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Initiation au C -Configuration 



Cet article ne va beaucoup parler du langage C, mais plutot de I'environnement defini par ORCA/C. 
D'ailleurs, tout ce qui est dit dans cet article s'applique aussi pratiquement tel quel a ORCA/M et a 
ORCA/Pascal. 

En fait, on peut distinguer 2 environnements : celui des disquettes telles qu'elles sont fournies par 
ByteWorks, et celui mis en place lors de Pinstallation du compilateur sur votre disque dur. Vous avez 
maintenant tous un disque dur, non ? 

Si tel n'etait pas le cas, I'environnement cible doit etre a priori le meme que celui fourni 
initialement, mais franchement, je n'ai pas le courage de le verifier. Comme je vous I'ai dit des le 
premier article, il me parait indispensable de posseder un disque dur pour travailler serieusement dans 
un environnement de programmation (il en est d'ailleurs de meme avec le Pascal ou I'assembleur, a partir 
du moment ou vous souhaitez ecrire de veritables programmes). La suite de cet article ne fera 
essentiellement reference qu'a I'utilisation de I'environnement depuis un disque dur. 

La version Studiee est la v1.2 du compilateur. Cette version corrige la plupart des bugs de la version 
1.1, notamment ceux de I'optimiseur. Elle n'en est malheureusement pas totalement exempte elle meme, 
comme nous aurons I'occasion de le voir par la suite. 

Si vous utilisez encore une version anterieure a celle-ci, je vous recommande vivement de faire la 
mise a jour, d'autant qu'elle ne coute que $10 si vous faites I'impasse sur la documentation (sa mise a 
jour vous coutera $20 de plus; je pense cependant que si vos moyens vous le permettent, il est souhaitable 
de I'avoir aussi a jour). Mais peut-etre est-il deja trop tard pour beneficier de ces tarifs ? J'espere en 
tout cas que vous etes un possesseur legal du compilateur : je tiens en effet a ce que Mike Westerfield 
puisse continuer a faire evoluer ses produits (et a beneficier des mises a jour pour si peu cher), et ne soit 
pas condamne a cesser son activite a cause des pirates. 

Le contenu des disquettes 



La boite de ORCA/C 1.2 comprend 4 disquettes dont voici une description succinte, ainsi que du contenu 
de chacun de leurs repertoires : 

• La disquette "Apple IIGS System Disk" contient, comme son nom I'indique, le systeme du GS dans sa 
version 5.0.4. II n'y a rien de particulier a dire sur cette disquette, sinon qu'il s'agit d'une version 
partielle, et que vous pretererez done installer la version complete que vous aurez obtenu par ailleurs. 

• La disquette "ORCA/C Program Disk" contient I'essentiel de I'environnement necessaire a 
I'utilisation de ORCA/C en mode bureau, a I'exception de quelques fichiers employes dans certains cas tres 
particuliers. Si vous ne possedez pas de disque dur, e'est en fait la disquette avec laquelle il vous faudra 
travailler, du moins avec une copie que, j'en suis sur, vous n'aurez pas oublie de realiser. 
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Les fichiers presents sur cette disquette se repartissent de la fagon suivante 



W 



:ORCA.C 

ORCA.SYS16 II s'agit du shell mode texte vl.2.1 

SYSTEM Catalogue contenant les fichiers systeme d'ORCA 

LOGIN Instructions a executer lors du demarrage du shell 

SYSCMND Table des commandes reconnues par le shell, et liste 

des langages installes et des utilitaires disponibles 

SYSTABS Tabulations des editeurs pour les differents langages 

LANGAGES Catalogue contenant les compilateurs et le linker 

CC Le compilateur ORCA/C 

LINKER Le linker d'ORCA 

LIBRARIES Catalogue contenant les librairies de ORCA/C utilisees lors de la phase de link 

ORCALIB Librairie specifique d'ORCA/C 

SYSLIB Librairie des fonctions generales d'ORCA que Ton retrouve avec I'assembleur ou 

le Pascal 
ORCACDEFS Catalogue contenant la plupart des fichiers "header" a inclure au debut de vos 

programmes C (le contenu de ce catalogue n'est pas liste car trop long). 
UTILITIES Catalogue des utilitaires ou commandes externes 

HELP Catalogue des fichiers d'aide des commandes du shell (ce catalogue est vide sur la 

disquette, faute de place). 
PRIZM Environnement en mode bureau lance par le LOGIN 

MAKELIB Gestion de librairies utilisables par le linker 

ICONS ORCA. ICONS Les icones d'ORCA pour le Finder™ 

SAMPLES Catalogue de quelques exemples de programmes C (vous pouvez le supprimer si 

vous travaillez sur disquettes pour gagner un peu de place). 



• La disquette "ORCA/C Extras" contient le reste de I'environnement tel qu'il sera installe sur votre 
disque dur. II contient tous les fichiers qui ne sont pas indispensables a la bonne marche du compilateur, 
mais qui peuvent etre necessaires dans certains programmes. L'environnement en mode texte, notamment 
I'editeur, se trouve aussi sur cette disquette, ainsi que les outils d'installation standard de GS/OS. 






Elle contient essentiellement les memes catalogues que la disquette programme, chacun 
possedant les fichiers suivants : 



d'entre eux 



.CC.EXTRAS 

INSTALLER 
SCRIPTS 

SYSTEM 

EDITOR 

SYSHELP 

SYSEMAC 

TEXT.LOGIN 

SYSCMND.PAS.ASM 

LIBRARIES 
PASLIB 



Programme d'installation de GS/OS 

Catalogue des scripts d'installation de ORCA (nous allons les voir en detail plus 

loin) 

Complements au catalogue systeme pour le mode texte 

Editeur en mode texte 

Fichier d'aide de I'editeur 

Macros dSfinissables dans I'editeur 

Fichier de login remplagant le precedent lorsque Ton choisit le mode texte 

Table des commandes du shell lorsque Ton possede aussi le Pascal et/ou 

I'assembleur. 

Catalogue de librairies complementaires 

Librairie du langage Pascal, necessaire si on doit faire cohabiter les 2 

environnements. 
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ORCAGLIB 



Librairie C lorsque Ton utilise le modele de memoire dit large, a installer et a 
utiliser a la place de la precedente (ORCALIB) uniquement dans ce cas. Dans la 
pratique, vous ne devriez pas en avoir besoin, car contrairement a ce que dit la 
documentation, on peut continuer a utiliser le petit modele meme si Ton alloue 
plus de 64K de memoire d'un seul tenant, pourvu que Ton y accede par des 
pointeurs. 






ORCACDEFS Catalogue de fichiers "header" juges moins indispensables. On y trouve 

neanmoins GSOS.H qui est necessaire si vous appelez directement les primitives 

du systeme. 

Les problemes commenceront a se poser aux non possesseurs de disque dur qui 

voudront utiliser les outils correspondant a ces fichiers, par exemple les outils 

musicaux, faute de place sur leur disquette, sauf en utilisant la technique decrite 

plus loin. 
AINCLUDE:M16.CC Macros a employer avec ORCA/M lorsque vous desirez mixer du C et de 

I'assembleur. Son utilisation est decrite dans la documentation de ORCA/C. 

Catalogue de commandes supplementaires 

Catalogue de tous les fichiers d'aide (celui-ci est plein !) 

Utilitaire de compactage des fichiers objets apres des 

compilations partielles 

Commande de formatage d'une disquette 

Notes de mise a jour de la version 1.2 

Qui appeler en cas de probleme. 



UTILITIES 

HELP 

CRUNCH 

INIT 

RELEASE.NOTES 

TECH.SUPPORT 



• La disquette "Samples" contient un ensemble d'exemples demontrant les differentes 
facettes du langage. II n'y a pas grand chose de plus a en dire. 



L'installation sur le disque dur 






Cette installation consiste essentiellement a creer I'arborescence des catalogues listes precedemment 
et d'y copier la plupart des fichiers des disquettes "Program" et "Extras". Cependant, cette arborescence 
peut demarrer d'un catalogue quelconque de votre disque, et pas obligatoirement du principal. 

Par exemple, chez moi, les catalogues du premier niveau ci-dessus sont localises dans le 
sous-sous-catalogue *:DEV:ORCA. Notez que dans ce dernier cas, le catalogue SYSTEM de ORCA/C n'aura 
rien a voir avec celui defini par GS/OS, puisqu'il doit se trouver dans le meme catalogue que le shell 
(ORCA.SYS16). 

Differentes options d'installation vous sont offertes. Ces options sont accessibles a travers plusieurs 
scripts de rinstaller". Ces scripts, au nombre de 7, repondent a la plupart des cas possibles; il est done 
preferable d'installer ou de mettre a jour votre environnement ORCA avec rinstaller, quite a I'adapter a 
vos besoins apres. 

En void la liste commentee et classee par fonction : 

• Si vous installer ORCA/C la premiere fois, il vous faudra choisir entre : 






"New System" : 

Ce script installe la totalite de I'environnement, aussi bien le mode bureau de PRIZM que le mode 
texteclassique. Cette installation ne peut se faire que sur un disque dur, puisque le contenu des disquettes 
:ORCA.C et :CC. EXTRAS est recopie. 
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Cependant, le login est configure pour lancer PRIZM automatiquement; si vous preferez travailler en 
mode texte, il vous faudra soit I'editer, soit le remplacer par le fichier TEXT.LOGIN decrit plus haut. 

Dans la pratique, c'est le script que vous serez sans-doute amenes a employer. 

Si ("utilisation principale de votre GS est la programmation, et que vous souhaitez demarrer 
automatiquement dans ORCA, il vous faudra choisir le catalogue de votre volume de boot comme cible de 
I'installation d'une part, et vous assurer que le fichier ORCA.SYS16 est le premier fichier S16 suffixe 
.S16 ou SYS suffixe .SYSTEM de ce catalogue et qu'il n'y a pas de fichier START dans votre catalogue 
:SYSTEM, d'autre part. 

Ce script correspond au fichier :SCRIPTS:ORCA.HD. 

"New Text System" : 

Ce script n'installe que I'environnement texte, a I'exclusion de tout ce qui concerne le bureau, 
notamment les fichiers header d'interface avec la toolbox. 

A moins que vous n'envisagiez de programmer qu'en C standard pur et dur et portable, ce script ne 
sert a rien. 

A la limite, vous pouvez I'utilisez puis copier manuellement tous les fichiers header des disquettes 
:ORCA.C et :CC.EXTRAS, mais c'est loin d'etre le plus pratique. 

Ce script correspond au fichier :SCRIPTS:ORCA.TEXT. 

• Si vous avez deja installe une version precedente de ORCA/C ou que vous disposez d'un autre des 
compilateurs de ByteWorks, il vous faudra choisir parmi les scripts de mise a jour, a savoir : 

"Update System" : 

Ce script est le pendant de "New System". II installe la meme chose, a I'exception des fichiers de 
donnees que Ton trouve dans le sous-catalogue :SYSTEM (LOGIN, SYS?) car ceux-ci ont probablement ete 
adaptes par vos soins. 

Si vous utilisez ce script alors que vous n'avez pas deja installe le C, il vous faudra modifier la table 
de commande (SYSCMND) manuellement en ajoutant la ligne : 

CC *L 8 

Si vous installez le C alors que vous avez deja installe le Pascal, il vous faudra proceder a une 
deuxieme 6tape, decrite un peu plus loin. 

Ce script correspond au fichier :SCRIPTS:ORCA.UPDATE. 

"Update Text System" : 

Ce script correspond a la mise a jour de "New Text System" et suivant les memes principes que le 
precedent. 

Ce script correspond au fichier :SCRIPTS:ORCA.TUPDATE. 

"Update Text System, No Editor" : 

Ce script est le meme que le precedent, sauf qu'il ne met pas a jour I'editeur. La raison est qu'il existe 
maintenant plusieurs editeurs de substitution a I'editeur standard et sensiblement plus sophistiques 
(Edlt-16, MaxEdit, ...). 

Malheureusement, cette possibility n'est offerte que pour la mise a jour la moins interessante des 2 
pr6c§dentes; si vous disposez de I'un de ces editeurs et que vous voulez mettre a jour I'ensemble des 
fichiers, il vous faudra le sauvegarder avant I'installation, puis le restaurer apres. 

Ce script correspond au fichier :SCRIPTS:ORCA.TNE. 



•^ 
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• Deux scripts completent cet ensemble : 

"ORCA Icons" : 

Ce script vous permet d'installer les icones du shell et des differents types de fichiers geres (sources, 
objets, executables ...) pour le Finder™. Si vous n'utilisez pas ce dernier (par exemple, si vous bootez 
directement dans ORCA), vous pouvez ne pas les installer. 

Ce script correspond au fichier :SCRIPTS:ORCA.ICONS. 

"ORCA Pascal, C, Asm Libraries" : 

Ce script installe la librairie Pascal, tout en mettant I'ensemble des librairies dans le bonordre (qui 
doit etre ORCALIB — ou ORCAGLIB — PASLIB et enfin SYSLIB), sinon des erreurs peuvent apparaitre 
pendant le link (meme si vous n'utilisez qu'un seul des 2 langages). 

Si vous n'avez pas ORCA/Pascal, il n'est pas necessaire d'utilisez ce script, car la presence de la 
librairie ralentira legerement la phase de link et consommera un tout petit peu plus de memoire. 

Si vous avez ORCA/M et ORCA/C, vous n'avez pas besoin de Putiliser non plus, car la librairie de 
I'assembleur (SYSLIB) est installee d'office. 

Ce script met aussi a jour la table de commandes (SYSCMND) avec la definition des 3 compilateurs (il 
faut bien sur les posseder pour pouvoir les utiliser). Si vous aviez modifie ce fichier, par exemple pour 
ajouter vos propres commandes externes, n'oubliez pas de le sauver avant ! 

Ce script est a utiliser en general apres Installation ou la mise a jour principale. 

II correspond au fichier :SCRIPTS:ORCA.LIBRARIES. 



Fonctionnement general de I'environnement 

Que vous ayez choisi de travailler en mode bureau avec PRIZM ou en mode texte, le shell est toujours 
execute en premier. Des qu'il prend le controle du GS, il charge sa table de commandes situee dans le 
fichier :SYSTEM:SYSCMND, et qui doit etre un fichier texte (ou SRC). Si il ne peut la trouver ou la lire, ou 
qu'elle est incorrecte, le shell s'interrompra avec une erreur fatale, et il vous faudra redemarrer 
(attention si vous lancez le shell au moment du boot I J'ai peur que dans ce cas, il vous faille booter a 
partir d'un autre disque systeme). 

Le shell definit ensuite la plupart des prefixes originaux de ProDOS-16 (ceux de numeros inferieurs 
a 8) de fagon a ce qu'ils correspondent aux differents sous-catalogues crees lors de ('installation. En voici 
la liste (le prefixe numero 1 est positionne automatiquement par GS/OS pour pointer sur le catalogue du 
programme, ici le shell ORCA.SYS16): 

• 2 1/Libraries 

• 3 1 

• 4 1/System 

• 5 1 /Languages 

• 6 1 /Utilities 

Personnellement, j'ai ajoute dans mon fichier LOGIN les definitions suivantes : 

• 3 1/Temp 

• 7 2/OrcaCDefs 

Le prefixe 3 pointe sur le catalogue dans lequel seront stockes d'une part le resultat des commandes 
copier/couper de I'editeur (ce fichier s'appelle SYSTEMP), ainsi que les fichiers temporaires crees par 
("utilisation des "pipes" (le symbole | qui permet de joindre plusieurs commandes, la sortie de la 
premiere devenant I'entree de la seconde), ces fichiers sont nommes SYSPIPEn, n etant le numero d'ordre 
de la commande dans la serie (on peut en effet en enchainer plusieurs de cette facon). 
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Le prefixe 7 est inutilise normalement par ORCA; la definition ci-dessus me permet d'acceder 
directement aux fichiers de description de interface avec la ToolBox. 

Le shell execute enfin le fichier LOGIN (si il existe; dans le cas contraire, le shell affiche directement 
son prompt "#") qui doit se trouver dans le catalogue pointe par le prefixe 4. Ce fichier permet de 
personnaliser son environnement, par exemple en definissant des alias pour certaines commandes, en 
positionnant certaines des variables standard; par exemple, vous pouvez y placer les instructions "set 
KeepName $" et "export KeepName" de fagon a ne pas avoir a utiliser I'option "keep=" lors de 
I'utilisation des commandes "cmpl" ou "link" si vous utilisez le mode texte. Vous pouvez aussi definir les 
prefixes que vous souhaitez (rappelez-vous qu'il y en a 32 disponibles) comme indique precedemment. 

Si vous preferez I'environnement de bureau, votre fichier LOGIN devra executer a sa fin la commande 
PRIZM (ce qui est le cas si vous avez effectue une installation complete), qui n'est en fait qu'une 
commande comme les autres, si bien que vous pouvez le lancer et le quitter a tout moment. 

Le catalogue SYSTEM identifie par le prefixe 4 est utilise essentiellement par I'editeur, une fois que le 
shell a termine son initialisation. Lorsqu'en effet, vous tapez une commande EDIT en mode texte, le shell 
cherche un programme EDITOR de type EXE dans ce catalogue. Si vous utilisez un editeur de remplacement, 
il vous suffira done de remplacer le programme EDITOR par cet Editeur et de lui donner le type EXE (au cas 
ou ce serait S16); e'est tout ! L'editeur utilise le fichier SYSTABS decrivant les tabulations souhaitees en 
fonction du numero du langage; ce fichier est aussi utilise de la meme fagon par PRIZM). 

Le catalogue LANGUAGES identifie par le prefixe 5 contient les compilateurs des langages installes 
ainsi que le linker. Lorsque vous lancez la compilation d'un programme C, le shell identifie le langage a 
I'aide du champ "auxtype", qui dans ce cas vaut 8, puis a I'aide de sa table de commande associe ce numero 
au langage C et done au compilateur CC. Notez que le nom du langage defini dans la table SYSCMND doit etre 
le meme que le nom du programme compilateur; e'est aussi ce nom qui est affiche par la commande 
CATALOG, et enfin le nom de la commande que vous devrez taper avant d'editer un nouveau fichier, de fagon 
a ['identifier correctement; dans le cas contraire, il vous faudra le modifier apres coup avec la commande 
CHANGE. Si vous travaillez essentiellement avec un langage, par exemple le C, il peut etre judicieux de 
placer la commande CC dans votre fichier LOGIN; ainsi tous les nouveaux programmes seront identifies 
correctement. 

Le catalogue LIBRARIES identifie par le prefixe 2, ainsi que ses sous-catalogues (il y en a un pour 
chacun des langages installes, leurs contenus correspondant aux interfaces de ces langages avec entre 
autres la ToolBox), n'est pas utilise par le shell, mais plutot par les compilateurs et le linker. 

Par exemple, lorsqu'en C vous employez I'instruction "#include <xxx.h>", vous indiquez au 
compilateur qu'il doit alter chercher ce fichier dans le catalogue "2/OrcaCDefs". 

ORCA/Pascal va lui chercher les Units referencees dans I'instruction USES dans le catalogue 
"2/OrcaPascalDefs". En revanche, lorsqu'en C vous utilisez la syntaxe "#include "xxx.h"", le 
compilateur regardera dans votre catalogue courant (identifie par le prefixe 0) si le nom est partiel et a 
I'endroit indique si vous avez specifie un chemin complet. 

Le linker lui n'utilise que les fichiers de type LIB de ce catalogue et ne va jamais regarder dans les 
sous-catalogues. II les consulte dans I'ordre de leur apparition dans le catalogue, et une fois qu'il a fini 
d'en traiter une, il passe a la suivante, sans jamais revenir aux precedentes, meme si des references 
externes n'ont pas pu etre resolues; e'est pourquoi I'ordre est tres important. Si vous etes amenes a 
ecrire des librairies et que vous souhaitez que le linker les regarde automatiquement, il vous faudra les 
placer avant les librairies standard — et done utiliser un programme de tri de catalogue, tel que 
Prosel-16 — notamment si elles sont ecrites en C ou en Pascal, car vous ferez alors inevitablement 
reference aux librairies systeme. 

Le catalogue UTILITIES identifie par le prefixe 6 contient les commandes externes du shell, ainsi que le 
sous-catalogue HELP des fichiers d'aide. 

Si vous developpez un programme fonctionnant dans le mode texte du shell et que vous souhaitez 
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pouvoir I'utiliser quelque soit le catalogue dans lequel vous vous situez, le plus simple est d'ajouter une 
ligne dans la table de commandes SYSCMND prenant la forme "mon_utilitaire *U", le caractere "*" etant 
utilise si vous voulez pouvoir redemarrer ce programme directement en memoire sans le recharger 
(pourvu que la place soit suffisante pour le conserver), car vous I'utilisez souvent. Vous devrez aussi bien 
entendu recopier ce programme dans le catalogue 6. Une autre possibility est de definir un alias vers ce 
programme en specifiant le chemin complet, si vous preferez ne pas modifier ce catalogue ou la table de 
commande; en revanche, vous ne pourrez pas le faire redemarrer en memoire. Dans les 2 cas, il vous 
suffira alors de taper son nom, eventuellement suivi de ses parametres pour I'executer automatiquement. 

Ce programme peut aussi bien etre un fichier de type EXE que S16 ou SYS ou encore EXEC (dans les cas 
S16 et SYS, le shell les lancera par un QUIT GS/OS et vous ne pourrez alors pas leur passer de parametres 
— le shell n'utilise pas (encore) Message Center), mais a mon avis il est preferable que ce soit un fichier 
de type EXE, sauf dans le cas ou il utilise des ressources, et qu'il n'ouvre pas lui meme son resource fork 
(StartUpTools ouvrira celui du shell, qui de toutes fagons n'existe pas). La table de commandes peut Stre 
rechargee par le shell sans le quitter, en utilisant la commande COMMANDS 4/SYSCMND; celle-ci a 
cependant aussi pour effet de purger la memoire de tous les programmes residents, suite a I'utilisation de 
"*U" et "*L". 

Pratiquement tous les programmes C (et Pascal) sont redemarrables en memoire : 

il suffit d'initialiser les variables globales dans le programme principal ou dans un sous-programme 

quelconque, et non pas en utilisant la syntaxe d'initialisation automatique des variables presentee la 

derniere fois (qui elle n'aura lieu que lors du chargement depuis le disque). 

Lorsque vous employez la commande HELP, si vous n'avez pas specifie la commande pour laquelle vous 
souhaitiez avoir de I'aide, elle vous affiche le contenu de la table de commandes du shell, sinon elle effectue 
un simple affichage du fichier ayant le meme nom que le parametre et etant situe dans le catalogue 6/HELP. 

Conclusion 



Voila, je pense avoir fait le tour de I'environnement d'ORCA, qui de part son utilisation des prefixes 
est assez souple. 

Si par exemple, vous n'avez pas de disque dur, mais 2 lecteurs de disquettes, vous pouvez envisager de 
repartir I'environnement sur 2 disquettes, et modifier les prefixes dans le fichier LOGIN pour pointer sur 
les bons catalogues; attention cependant au fait que GS/OS aime bien avoir le disque de boot toujours 
present, notamment si vous utilisez des programmes avec des ressources; on doit cependant arriver a s'en 
sortir en installant le shell a la place du Finder™, ainsi que le catalogue SYSTEM de ORCA dans le catalogue 
SYSTEM d'origine, eventuellement PRIZM (et le reste de UTILITIES a I'exclusion des fichiers d'aide) si il 
reste suffisamment de place et que vous souhaitez utiliser I'environnement de bureau, le reste etant 
installe sur la deuxieme disquette. 

Vous pouvez aussi envisager d'avoir 2 arborescences de librairies, une pour le petit modele et une 
autre pour le grand, et faire pointer le prefixe 2 sur I'une ou sur I'autre selon les besoins (les autres 
fichiers, notamment le sous-catalogue ORCACDEFS, devront etre en double), encore que je n'ai pas trouve 
de cas ou il faille utiliser le grand modele. 

Je n'ai pas parle du processus d'edition/compilation/link, car il varie selon que vous utilisez le shell 
en mode texte ou I'environnement du bureau de PRIZM. II est cependant assez simple dans les 2 cas pour 
que vous puissiez vous debrouiller tout seuls. 

Ah oui ! J'ai failli oublier de parler des bugs. En fait, je n'en ai vraiment trouve" qu'un jusqu'a 
present, mais qui m'a fait passer beaucoup de temps, etant donne que cela marchait avec la v1.1. 

Les fichiers d'interface de la ToolBox sont fournis par Apple et livres tels quels par ByteWorks. Des 
que vous voulez en utiliser un, il vous faut tout d'abord inclure le fichier "Types. h" (c'est de toute fagon 
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fait automatiquement par I'ensemble des fichiers header de la ToolBox) qui definit les constantes et les 
types de base, notamment la constante NULL de la fagon la plus standard : 

#define NULL OxOL 

Cependant ORCA/C genere du code faux (qui seme la panique dans la pile) lorsque Ton affecte cette 
constante a un pointeur, ce qui est quand meme le BA BA de I'utilisation des pointeurs ! Heureusement la 
correction est simple : il vous suffit de modifier Types. h de sorte que la definition soit : 

#define NULL (void *) OxOL 

C'est a dire que Ton transforme explicitement la constante en pointeur, ce que devrait faire 
implicitement le compilateur, comme c'etait le cas en v1.1. 

Cette definition est faite ainsi dans le fichier stdio.h que Ton inclut a la place de Types. h lorsque Ton 
n'utilise pas la ToolBox. 

Si vous avez besoin d'autres precisions sur I'environnement de ORCA, n'hesitez pas a m'en faire part. 
J'essaierai d'y repondre, dans la mesure de mes moyens, soit par un article, soit par un petit mot dans la 
rubrique Forum C. 

Vous trouverez la suite de I'initiation au langage C dans le prochain numero de GS Infos, dans lequel 
nous finirons enfin par parler des operateurs et des expressions ... 
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Initiation au langage C 



Introduction 

Cet chapitre est le premier d'une nouvelle (et je I'espere longue) serie d'initiation au langage C. 

Cette serie suppose que vous possedez deja des rudiments de programmation, par exemple en Basic ou 
en Pascal, que vous pouvez avoir acquis apres avoir etudie les articles sur le Pascal ou I'algorithmique 
parus dans les precedents numeros de GS Infos. 

II sera fait de temps a autre reference au Pascal, qui est le langage le plus connu dans la communaute 
des utilisateurs programmeurs de I'Apple IIGS, a titre de comparaison et pour faciliter les explications. 

Cependant, si vous n'avez aucune connaissance de programmation, restez quand meme avec nous, 
j'essaierai de vous faire decouvrir ce langage et peut etre vous allez figurer a votre tour dans la longue 
liste des programmeurs sur Apple IIGS. 

Ces articles doivent servir de forum sur le langage C, et j'ai par consequent besoin de savoir si le 
contenu et/ou le niveau vous satisfont (ou si ce dernier est trop eleve ou trop simpliste), si vous voulez 
voir traiter certains sujets particuliers, etc ... 

Pour ce faire, vous pouvez me contacter a I'adresse suivante : 

Philippe Manet 
40 rue Victor Hugo 
94700 Maisons Alfort 

Apres les presentations d'usage, entrons maintenant dans le vif du sujet, en rappelant d'abord 
I'historique du langage, puis en presentant les compilateurs disponibles sur I'Apple IIGS. Une 
bibliographie et nos premiers programmes C completent ce premier article. 






Un peu d'histoire 



Le langage C est ne au debut des annees 70 (a peu pres en meme temps que Pascal) de I'imagination 
fertile de Dennis Ritchie, chercheur aux laboratoires BELL de AT&T (les telephones americains). L'objet 
de I'inventeur etait de definir un langage d'assez haut niveau fournissant des structures de controle 
completes permettant la programmation dite structured, mise en avant par Algol puis Pascal. II avait 
cependant aussi besoin d'un langage ayant une grande puissance dans le traitement des expressions de calcul 
et ayant des types de donnees de base proches de ceux disponibles dans la machine, puisqu'il voulait se 
servir de ce langage pour developper un systeme d'exploitation, ce qu'il fit avec Unix. 

C est derive d'un langage plus simple (il n'avait par exemple qu'un type entier) appele, je vous le 
donne dans le mille ... B. 

Je vous rassure tout de suite, C est complement independant d'Unix, comme nous le verrons dans les 
prochains articles. On peut done apprendre et programmer en C, sans jamais penser a Unix ou a aucun 
autre systeme d'exploitation particulier. 
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Bien que deja ancien, le langage n'a connu une veritable popularity que dans les annees 80, avec 
I'avenement de la micro-informatique, et plus particulierement du monde MS-DOS; la plupart des 
applications de cet environnement sont d'ailleurs ecrites en C. Comme c'est le cas avec Unix, le langage C 
n'a (heureusement !) rien a voir avec la galere MS-DOS (a titre d'anecdote, les americains disent en 
general MeSs (ou MeSsy)-DOS, ce qui veut dire a peu pres Systeme d'Exploitation M ). 

Malgre son anciennete, le langage n'a subi que tres peu devolutions depuis ses origines, preuve de son 
efficacite. Les plus importantes d'entre elles ont ete apportees par la normalisation du langage par I'ANSI 
(I'equivalent americain de notre AFNOR) qui n'est toujours pas validee a ma connaissance. Ces nouvelles 
fonctionnalites concernent plus particulierement la qualite" des programmes sources grace a un mecanisme 
appele prototypage (nous verrons plus loin que ce terme savant recouvre un concept de base de Pascal). 
Precedemment, il etait possible de faire a peu pres n'importe quoi dans les passages de parametres a des 
sous-routines (c'est d'ailleurs toujours possible, le prototypage etant optionnel), ce qui contribue a la 
puissance, mais aussi a I'opacite" (pour ne pas parler des difficultes de mise au point) qui ont fait la 
reputation de C. La norme ajoute aussi la notion de type enumere (qui existe depuis toujours en Pascal) 
ainsi que d'autres petites choses qu'il n'est pas utile de lister ici. 

Une autre evolution du langage C a debute au debut des annees 80 par un autre chercheur des 
laboratoires Bell (Bjarne Stroustrup), visant a integrer au langage des nouveaux concepts dits "orientes 
objets" mis en avant par SmallTalk (pour ceux qui en ont entendu parler). Ces recherches ont conduit a un 
nouveau langage, non pas appele D, mais C++. En dehors de ces nouveaux concepts, C++ apporte des 
nouvelles fonctions au C, permettant d'ameliorer sensiblement la qualite du code source; une partie de ces 
ameliorations a d'ailleurs servi de base aux travaux de normalisation du langage C. C++ se presente le plus 
souvent sous forme d'un pre-prossesseur traduisant le programme en C et qui est compile ensuite par ce 
dernier; il commence aussi a exister des compilateurs natifs C++. Le demarrage de C++ est fulgurant, 
surtout dans le monde des clones PC et plus moderement sur le Macintosh. A ce jour, il n'y a pas de 
compilateur, ni de pre-processeur C++ pour Apple IIGS. 

Le C et I'Apple IIGS 



w 



— 



II existe aujourd'hui 2 implementations du langage C sur Apple IIGS (il existe aussi des 
implementations en ProDOS 8, dont la plus connue est AZTEC C, mais nous n'en parlerons pas ici) : 

- APW C est la version proposee par Apple et la premiere disponible. Elle est aujourd'hui un peu 
depassee, et elle n'est pas vraiment supportee. De plus, elle ne respecte pas la norme ANSI. Cette version 
requiert I'environnement APW/ORCA et ne peut s'utiliser qu'en mode texte. La librairie run-time (les 
fonctions standards fournies par le langage) est tres mauvaise, si bien que le moindre programme (y 
compris un programme vide ne faisant rien !) genere un executable de taille impressionnante (plusieurs 
dizaines de KO). Ceci contraint a disposer d'un minimum de memoire suffisant, 2 MO semblant 
raisonnable. 

- ORCA/C est la version developpee et vendue par Byte Works. II en est aujourd'hui a la version 1.2 
(qui vient juste de sortir). Cette version est maintenant assez stabilisee et de bonne qualite. ORCA/C est a 
la norme ANSI, ce qui facilite la mise au point des programmes, si on en utilise les possibilites, et evite 
ainsi des maux de tete causes autrement par les nombreux crashes. ORCA/C peut etre utilise dans 
I'environnement texte APW/ORCA ou dans I'environnement de bureau PRIZM fournis en standard avec le 
compilateur. La librairie run-time est de bonne qualite, evitant de generer des programmes de grosse 
taille. 

Bien que fonctionnant dans la configuration de base de 1,2 MO, il est recommande d'augmenter sa 
memoire a 1,5, voire 2 MO pour des programmes de bonne taille, sinon les acces disques sont nombreux 
pendant les compilations (surtout si vous utilisez la toolbox, car il y a alors beaucoup de fichiers a 
inclure). Le compilateur dispose aussi d'une fonction d'optimisation du code objet, diminuant la taille du 

Chapitre 1 page 2 



■~- 






Initiation C - Chapitre 1 
programme final et amSliorant les temps d'ex§cution. Enfin, et ce n'est pas le moindre de ses avantages, 
ORCA/C possede une fonction de mise au point (debugger en anglais) du code source, c'est a dire que vous 
pouvez placer directement des points d'arret et examiner les variables dans le programme C original et 
non pas dans le programme objet resultant de la compilation. 

Pour toutes les raisons evoquSes ci-dessus, et pour vous initier a une "bonne" ecriture en C, les 
articles suivants seront bases sur ORCA/C. 

Vous pourrez cependant utiliser APW C au prix de legeres adaptations des programmes presentes. Le 
present article vous montrera le type de modifications que vous serez amends a effectuer. 

Quelque soit votre choix, vous devez envisager I'achat d'un disque dur. Les 2 compilateurs fonctionnent 
correctement avec 2 lecteurs de disquette, voire meme 1 pour ORCA/C, mais si vous vous lancez dans le 
dSveloppement d'un programme de bonne faille, vous vous apercevrez rapidement qu'un disque dur devient 
rapidement indispensable. 



Bibliographie 

II existe une foule de livres d'initiation au langage C en francais, la plupart etant bases sur Turbo-C ou 
MicroSoft-C pour les PC. Je ne saurai vous en recommander un en particulier, ne les connaissant pas. 
Attention, cependant, la plupart des livres informatiques, surtout ceux d'initiation, sont mauvais, la 
plupart des auteurs se contentant de traduire le manuel d'utilisation original. A vous de faire le bon choix. 

Je peux malgre tout vous recommander la "bible", a savoir le livre "Le Langage de Programmation C" 
par Dennis Ritchie et Brian Kernighan paru chez Masson (veillez a ce que ce soit la 2eme edition prenant 
en compte les nouveautes de la norme ANSI). II s'agit de I'ouvrage de reference, ecrit par les inventeurs du 
langage. Sans etre forcSment simple, il est assez didactique et peut servir de manuel d'initiation au C. Un 
autre ouvrage complementaire peut etre utile (je ne me souviens pas du titre, mais il est aussi publie chez 
Masson et fait reference au precedent); il contient la solution des differents exercices proposes dans la 
bible, et peut ainsi etre utilise comme guide d'exemples pratiques du langage. 

Bien qu'il ne s'agisse pas d'un livre d'initiation au C, et qu'il commence a dater (il correspond a la 
version 3.1 du disque systeme), vous pouvez envisager I'achat du livre "Boite a outils de I'Apple IIGS" de 
J.P. Curcio paru aux editions du P.S.I, si il est encore disponible. Comme son nom I'indique, il decrit 
('utilisation de la boite a outils du GS, et tous les exemples sont en C. 

Vous pourrez trouver tous ces livres soit a la FNAC, soit chez Infotheque, 32 rue de Moscou, 75008 
Paris (c'est pres de la Gare St Lazare). Soit dit en passant, Infotheque vend I'ensemble de la documentation 
technique Apple IIGS, qui se revelera indispensable (3 volumes des Toolbox Reference Manual et GS/OS 
Reference Manual entre autres) des que vous voudrez realiser des programmes utilisant les specifiers de 
votre IIGS prefere. 



Notre premier programme C ! Enfin, me direz vous :-) 

Je ne vais pas entrer dans les details d'utilisation des differents environnements de programmation 
disponibles. Pour cela, vous devrez vous referer a la documentation fournie avec le compilateur choisi. Un 
atout de plus pour ORCA/C est qu'il dispose d'un environnement en mode "bureau" beaucoup plus simple a 
aprehender et tres bien explique dans le manuel. 

En tout etat de cause, je suppose que vous savez editer un programme et le compiler. 



... 
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Tout livre d'initiation au C propose comme premier programme I'affichage du message "hello, world". 
Alors allons y : 

void main ( void ) 

{ 

printf ( "hello, world\n" ); 

} 

Si vous compilez puis executez ce programme que vous aurez appele par exemple "hello. cc" (par 
convention, les programmes C ont le suffixe ".cc" indiquant leur type), vous devriez voir apparaitre le 
fameux message "hello, world" sur votre ecran. Si vous avez utilise I'environnement PRIZM, celui-ci 
apparaitra dans une fenetre appelee "shell"; cette fenetre permet d'exScuter les commandes du shell ORCA 
de la meme maniere qu'en mode texte. 

Tout programme C est compose d'un ou plusieurs fichiers sources (C supporte naturellement le 
concept de "compilation s§paree"; nous reviendrons sur ce sujet dans un prochain article), eux memes 
composes d'une ou plusieurs "fonctions". Une fonction C est equivalente a une procedure (ou une fonction) 
Pascal, et de maniere plus eloignee, a une sous-routine Basic. 

La fonction principale (celle par laquelle debute automatiquement I'execution du programme) doit 
s'appeler obligatoirement "main"; elle correspond au PROGRAM de Pascal. 

Vous avez sans doute remarqu§ que le programme precedent est en minuscules : 
ceci est extremement important, car le langage C, contrairement aux autres, fait la difference entre 
minuscules et majuscules. Ainsi, les mots clefs du langage doivent etre imperativement en minuscules, 
sinon ils ne seront pas reconnus par le compilateur. En revanche, vous pouvez utiliser aussi bien des 
minuscules que des majuscules dans les noms des variables ou des fonctions, sauf pour la fonction 
principale qui doit s'appeler "main" en minuscules. Attention cependant au fait que vous devrez toujours 
ecrire un symbole de la meme maniere : par exemple, "toto" est different de "TOTO" et de "Toto". 

Une fonction C se presente de la maniere suivante : 

type-du-r6sultat nom-de-la-fonction ( parametres-de-la-fonction ) 

{ 

code-de-la-fonction; 

} 

Contrairement a Pascal qui dispose de procedures effectuant des operations mais ne retoumant rien et 
des fonctions retournant une valeur, C ne dispose que de fonctions retoumant en principe toujours quelque 
chose; c'est pourquoi, il n'y a pas de mot cle" indiquant que Ton definit une fonction. 

Originellement, le champ "type-du-r§sultat" pouvait etre vide, ce qui ne voulait pas dire que Ton ne 
retournait rien (bien que ce fut generalement le cas), mais que Ton retournait un entier. A des fins de 
compatibilite, c'est toujours le cas. Cependant, la norme a ajoute un nouveau type de donnees reserve a la 
declaration d'une fonction et appele "void" (comme dans notre exemple precedent), ce qui veut dire vide. 
Une fonction retournant void (c'est a dire rien) est done strictement equivalente a une procedure Pascal. 
Dans le cas d'ORCA/C, il est utile de declarer les procedures comme des fonctions retournant void, car le 
compilateur utilise cette information pour optimiser le code genere. APW C ne dispose pas de ce type de 
donnees; on se contente alors de ne rien mettre du tout. 

Lorsque void est utilise dans le champ "parametres-de-la-fonction", cela signifie que celle-ci 
n'accepte aucun parametre, et demande au compilateur de verifier qu'effectivement, aucun parametre n'est 
passe a cette fonction. 
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C'est ce mecanisme, realist d'office en Pascal, que j'ai appele plus haut "prototypage" : il s'agit 
simplement de dire au compilateur de verifier la coherence des parametres d'une fonction entre sa 
definition et ses appels. 

Vous I'avez devine, ce controle n'etait pas effectue dans les versions de C anterieures a la norme; pour 
des raisons de compatibility avec des programmes anciens, le mecanisme de prototypage est optionel, et si 
les types des parametres ne sont pas specifies dans la declaration d'une fonction, le compilateur 
n'effectuera aucun controle, d'ou une mise au point nettement plus delicate, des erreurs evidentes n'etant 
pas detectees a la compilation. 

Ceci permet en revanche de faire des choses tres puissantes, comme par exemple de declarer une 
fonction avec 2 parametres entiers et de lui passer un entier long. 

Le programme precedent n'utilisant pas le prototypage (et done compilable avec APW C) s'ecrit done 

main () 

{ 

printf ( "hello, world\n" ); 



} 






Dans cet exemple, le compilateur C ne verifiera pas qu'aucun parametre n'est effectivement passe a 
cette fonction, alors qu'il I'aurait fait avec la version precedente. 

II est a noter que I'essentiel des modifications que vous aurez a apporter aux exemples donnes 
consistera en la suppression des prototypes, des types void (que vous pourrez remplacer par le type 
entier, si besoin est) et autres particulates de la norme que j'indiquerai par la suite. 

Vous avez deja devine que les "{" et "}" servaient a delimiter le corps d'une fonction; en fait, ils sont 
strictement equivalents aux "BEGIN" et "END" de Pascal. 

Le ";" est utilise identiquement a Pascal pour separer les instructions. II n'y a pas, en revanche, de "." 
final, la fonction principale "main" pouvant en fait se trouver n'importe ou dans le fichier source. 

Comme Pascal, C ne possede pas destructions d'entree/sortie. A la place, il offre un ensemble de 
fonctions standards presentes dans la librairie "run-time", "printf" fait partie de ce jeu de fonctions; il 
signifie affichage formate, et comme nous le verrons par le suite, il est beaucoup plus sophistique que ses 
equivalents WRITE/WRITELN du Pascal. 

Une chaine de caracteres C est delimitee par le caractere ". Un certain nombre de sequences 
predefines correspondent aux caracteres de controle les plus utilises. Ainsi la sequence "\n" correspond a 
"newline", et permet de passer a la ligne suivante; elle permet de realiserl'equivalent du WRITELN, 
excepte qu'elle peut se situer n'importe ou dans la chaine de caracteres. 

Si, par exemple notre programme precedent avait ete : 

void main ( void ) 

{ 

printf ( "hello\nworld\n" ); 

} 

I'affichage aurait ete constitue des 2 lignes : 

hello 
world 
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Les espaces de part et d'autre des () ne sont la que pour ameliorer la lisibilite du programme, et sont 
done tout a fait optionnels. Notre programme pourrait done s'ecrire (a I'extreme, j'en conviens) : 

void main(void){printf(' , hello J world\n");} 

ce qui est nettement moins lisible I 

Allons un peu plus loin 

Nous avons vu dans I'exemple precedent que la fonction "main" etait une fonction ordinaire, sauf 
qu'elle s'appelait "main" et que e'etait la premiere executee. Comme toute fonction, elle accepte des 
parametres, qui sont cependant predefinis, du fait qu'elle est appelee par une routine standard de la 
librairie run-time executee avant elle. 

Ces parametres correspondent a la ligne de commande qu'un utilisateur saisit dans un environnement 
de type "shell", tel celui de APW/ORCA. En revanche, si le programme est execute depuis le finder, par 
exemple, la ligne de commande ne correspond a rien, et aucun parametre n'est done passe a la fonction 
"main". 

Dans le shell APW/ORCA, il existe une commande standard "echo" qui affiche simplement la liste des 
arguments qui lui sont fournis. Si par exemple, je tape la commande : 

echo Ceci est un message 

Je verrai apparaitre sur mon ecran sur la ligne suivante : 

Ceci est un message. 

Dans I'exemple qui suit, nous allons voir comment realiser en C un programme qui realise exactement 
la meme fonction que la commande "echo". 

Un dessin valant mieux qu'un grand discours, void ce que cela donne : 

void main ( int argc, char argv[][] ) 

{ 
int i; 

for ( i = 1; i < argc; i++ ) { 

printf ( argv[i] ); 
if ( i < argc - 1 ) 
printf ( " " ); 
else 

printf ( "\n" ); 

} 
} 
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Appelez le echoc.cc puis compilez le et faites I'edition de liens. Si maintenant vous tapez la commande 
(si vous §tes dans PRIZM, utilisez la fenetre "shell") : 

echoc ca marche. 

Vous devriez alors voir le message : 

ca marche. 

juste en dessous. 

Si vous avez d§ja pratique le Pascal, vous devez reconnaitre certains elements du langage. Cependant, 
et afin de conserver un peu de suspense, les explications detainers ne vous seront donnees que dans le 
prochain article. 

La fonction "main" accepte 2 parametres qui sont le nombre d'arguments de la ligne de commande et un 
tableau de chaines de caracteres (en C, une chaine de caracteres est un tableau de caracteres, d'ou la 
description du parametre "argv" en tant que tableau a 2 dimensions). Un argument d'une commande est 
simplement une suite de caracteres quelconques exceptes I'espace et la fin de la ligne qui delimitent chacun 
de ces arguments; le dScoupage est fait automatiquement avant I'exScution de la fonction "main". Si Ton 
veut regrouper plusieurs mots separes par des espaces au sein d'un meme argument, il suffit de delimiter 
ces mots par des "; dans le cas du programme "echoc", le resultat sera strictement identique. 

Les noms de variable "argc" et "argv" sont ceux couramment utilises pour materialiser les arguments 
d'une commande; le "c" veut dire "count" (le nombre) et le "v" correspond a "vecteur", c'est a dire la liste 
des arguments proprement dits. 

Et apres ? 



Dans le prochain article, nous commencerons l'6tude de la syntaxe du langage C, et plus 
particulierement des types de donnees scalaires et des op§rateurs disponibles dans les expressions 
arithmetiques et logiques. 

Nous reprendrons le programme "echoc" precedent, en expliquant chacune de ses instructions, et en 
montrant comment il peut etre ecrit de maniere beaucoup plus synthetique; c'est ce qui fait la puissance du 
langage et si trop pousse a I'extreme sa complexity. 
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Initiation au Langage C (deuxieme partie) 



Avant d'entrer dans le vif du sujet, je voudrais faire un petit retour en arriere sur la bibliographie 
donnee dans le premier article. 

Je me suis apergu que j'avais donne un titre inexact pour la bible, que Ton appelle d'ailleurs le K&R 
(du nom de ses auteurs, Kernighan et Ritchie); son nom exact est le "Langage C 2eme edition et il est 
effectivement paru chez Masson. 

Depuis la derniere fois, je me suis renseigne sur les meilleurs livres disponibles, et on m'a 
recommande ces 3 titres (mais je n'ai pas verifie par moi-meme), qui sont des traductions de livres 
am6ricains publiees par Masson : 

• "Langage C : manuel de reference" de Samuel Harbison et Guy Steele, 2eme edition. II s'agit d'un 
manuel de reference tres complet et non pas d'un livre d'initiation, mais une fois que vous possederez les 
rudiments du langage, vous pourrez I'utiliser. 

• "Langage C : problemes et exercices" de Alan Feuer. C'est un livre d'exercices couvrant 
pratiquement tous les aspects du langage. Son interet est qu'il presente les erreurs les plus courantes, que 
vous serez sans aucun doute amenes a faire dans vos propres programmes, et donne bien entendu une 
correction a ces erreurs. 

• "Langage C : solutions" de Clovis Tondo et Scott Gimpel, 2eme edition. Ce livre donne une solution a 
I'ensemble des exercices proposes dans le K&R. 

J'en avais vaguement parle dans le precedent article, j'ai juste retrouve son titre et ses auteurs. 

Pour terminer, je vous donne I'adresse d'une autre librairie informatique sur Paris : 
Le Monde en Tique, 18 rue Maitre Albert, Paris 5eme. 

Contrairement a ce que j'avais annonce dans le precedent article, nous n'allons §tudier que les 
constantes et les types de base dans cette partie, tandis que nous traiterons des opSrateurs que Ton peut 
utiliser pour construire des expressions a partir de ces types dans 2 mois. La raison en est que je pense 
qu'il y a deja pas mal d'informations a ingurgiter dans cet article, et qu'il n'est done pas souhaitable de 
vous encombrer I'esprit des le d6but. Par consequent, nous ne reprendrons le programme echoc.ee que 
dans le prochain article. 

Le langage C 



Nous pouvons maintenant entrer de plain pied dans la syntaxe du langage C. 
Les donnees et leur types 



Un programme, par essence, manipule des donnees. Dans les langages modernes, ces donnees sont 
typees. De plus, elles represented soit des constantes (la donnee a une valeur fixe predetermined qui ne 
change jamais pendant le deroulement du programme), soit des variables (la valeur de la donnee varie au 
cours de I'execution du programme, par exemple a la suite d'un calcul). 

Le type d'une donn£e est utilise par le compilateur pour determiner les operations possibles sur cette 
donnee, ainsi que I'espace m6moire qu'elle occupe. 
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Une donnee, lorsqu'elle est mat§rialisee par une variable, est representee par 2 entites : pour le 
programmeur, il s'agit de son nom qui I'aide a I'identifier dans le corps de son programme, tandis que 
pour I'ordinateur, il s'agit de son adresse, qui lui sert a la localiser dans sa memoire. II taut bien 
comprendre que ces 2 denominations ne recouvrent qu'une seule et meme chose; c'est simplement le point 
de vue qui change. 



Format general d'un programme C 



Une instruction peut utiliser une ou plusieurs lignes, et une ligne peut comporter plusieurs 
instructions (bien qu'en general et pour des raisons de clarte on n'ecrit qu'une seule instruction par 
ligne); chaque instruction est terminee par le caractere ";". Les elements syntaxiques formant des mots 
doivent etre separes de leurs voisins par des espaces, des tabulations, des lignes blanches ou des 
commentaires; lorsqu'il s'agit d'un symbole definissant la ponctuation du langage, celui-ci peut etre 
accole" a un mot (par exemple x=3), cependant pour ameliorer la lisibilite du programme, 

je vous recommande d'utiliser un espace de part et d'autre du symbole (comme dans x = 3). 

Un commentaire est delimite par les sequences 7*" et "T qui ne peuvent etre imbriquees (il n'est 
pas possible d'avoir la sequence /* ... /* ... */ ... V). 

En revanche, on peut intercaler un debut de commentaire au milieu d'un commentaire, par exemple /* 
... r ... V. 

II est aussi possible de couper un element en 2 (un mot reserve, une chaine de caracteres ...) en 
utilisant le caractere de continuation V immediatement suivi d'un retour chariot. Attention, si au moins 
un espace vient a se glisser entre les 2, le compilateur n'identifiera plus cette sequence de continuation, et 
vous donnera une erreur; par consequent, je ne vous conseille pas d'utiliser cette possibility (d'ailleurs 
elle est rarement necessaire). 

Identificateurs 



Le langage definit la syntaxe des identificateurs utilises pour symboliser les constantes et les 
variables, mais aussi pour les fonctions. En C, un identificateur est constitue d'une lettre ou du caractere 
souligne "_", eventuellement suivi d'un ou plusieurs lettres, chiffres ou soulignes (il s'agit bien entendu 
des lettres de A a Z et de a a z sans aucun accent); ORCA/C limite la longueur d'un tel identificateur a 255 
caracteres, ce qui laisse tout de meme pas mal de liberie pour definir des noms significatifs. 

Je vous rappelle qu'en C, les minuscules et les majuscules sont traitees differemment dans un 
identificateur ("toto" est different de "TOTO" et de "Toto"). 

Les mots reserves du langage (ceux definissant sa semantique, c'est a dire les instructions de boucle, 
de test, de definition de types ...) ne peuvent etre utilises comme identificateurs. La liste des mots reserves 
est donnee dans le manuel de reference du compilateur; elle varie legerement entre ORCA/C et APW C. Les 
symboles speciaux (par exemple = * { }) sont aussi reserves et ne peuvent done etre utilises que dans le 
contexte de la fonction qui leur a ete assignee, sauf bien sur lorsqu'ils sont utilises dans une chaine de 
caracteres ou un commentaire. Une liste de ces symboles est aussi donnee dans le manuel de reference du 
compilateur. 

Les noms suivants sont des identificateurs valides en C : 

main, array (non ce n'est pas un mot clef), laFenetre, _special, 
un_tres_tres_tres_long_identicateur, z1 2 
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Les noms suivants ne sont pas des identificateurs C : 
45t, laFenetre, i% 
Constantes 



Les constantes sont utilisees pour representer des nombres entiers ou reels et des caracteres, soit 
unitairement, soit sous forme de chaines. Chacune de ces entites a une valeur prederminee au moment de 
I'ecriture du programme, et cette valeur ne peut pas etre modifiee au cours de I'execution de ce 
programme. 

Constantes entieres 



Les constantes entieres peuvent etre representees sur un mot (qui occupe 2 octets ou 16 bits) ou sur 
un mot long (4 octets, c'est a dire 32 bits). Elles peuvent §tre aussi signers ou pas. Une constante entiere 
peut enfin etre definie en decimal, en octal ou en hexadecimal. 

Nombres decimaux 



Un entier sur 16 bits permet de representer un nombre decimal compris entre -32768 et +32767 
si il est signe, ou de OU a 65535U si il ne Test pas; remarquez que pour signaler au compilateur qu'il 
s'agit d'un nombre non signe, on accole un "U" (cela signifie "unsigned" en anglais; on peut aussi utiliser 
le V) juste apres la valeur du nombre (sans aucun espace entre les 2). Si le nombre est en dehors des 
limites prec^dentes ou que Ton lui accole la lettre "L" ou "I" (pour "long"), il occupera 32 bits, ce qui 
permet de representer des nombres entre -2147483648L et +2147483647L ou OUL a 
4294967295UL. Dans le cas d'un entier long non signe, les symboles "L" et "U" peuvent etre specifies 
dans un ordre quelconque (c'est a dire soit "LU" ou "UL"). L'utilisation de nombres non signes a des 
implications sur les expressions dans lesquels ils apparaissent; ceci sera traite dans le prochain article. 

Nombres octaux 



Un nombre octal utilise les chiffres de a 7 au lieu des chiffres de a 9 du systeme decimal. C 
distingue ces nombres en les pr&ixant par le chiffre 0. 

Des qu'un nombre commence par (et que ce n'est pas le nombre bien sur !), il s'agit d'un nombre 
octal qui ne peut done utiliser les chiffres 8 et 9. 

Attention, car cela peut parfois creer des confusions et done donner des resultats pour le moins 
inattendus I Comme les nombres decimaux, les nombres octaux peuvent etre soit courts ou longs et signes 
ou non signes. 

Les limites sont alors de 0100000 a 077777 pour un entier court signe, de a 0177777U pour un 
entier court non signe, de 020000000000L a 017777777777L pour un entier long signe et de a 
037777777777UL pour un entier long non signe\ Notez que le nombre a la meme representation dans 
toutes les bases. 

Nombres hexadecimaux 



Un nombre hexadecimal utilise les chiffres de a 9 et les lettres de A a F (ou de a a f) pour 
representer les 16 unites de sa base. Les nombres hexadecimaux sont distingues des nombres decimaux et 
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octaux par le prefixe Ox (ou OX). Bien entendu, les nombres hexadecimaux peuvent aussi etre courts ou 
longs, sign6s ou non signes. Les limites sont alors de 0x8000 a 0x7FFF pour les entiers courts signes, de 
a OxFFFFu pour les entiers courts non signes, de 0x80000000L a 0x7FFFFFFF pour les entiers longs 
signes de de a OxFFFFFFFFuL pour les entiers longs non signes. 

Constantes caracteres 



Les constantes caracteres sont formees en entourant le caractere en question entre des apostrophes 
(comme dans 'a'). Une constante caractere est traitee de la meme maniere qu'une constante entiere dont la 
valeur est le code ASCII du caractere. De fait, ces 2 types sont interchangeables, ce qui, dans la pratique, 
permet de definir des variables entieres sur un octet (8 bits) et done d'economiser de la memoire. 
D'ailleurs, en C, le type caractere peut etre signe, comme nous le verrons plus loin. 

Sequences d'echappement 



Tous les caracteres du code ASCII ne sont pas directement accessibles au clavier; C permet de les 
representer sous la forme de sequences dites d'"escape" : une telle sequence commence par le caractere 
T et est suivie soit d'un autre caractere indiquant la fonction de la sequence ou d'un nombre octal ou 
hexadecimal donnant le code ASCII du caractere (notez que dans ce cas, un nombre hexadecimal commence 
simplement par "x" et non pas par "Ox" tandis qu'un nombre octal n'est pas obligatoirement precede par 
un "0"). Si le caractere suivant le "V ne fait pas partie d'une sequence predefinie, le compilateur 
considere ce caractere comme si il n'avait pas ete precede par le T (ainsi par exemple '\z' et 'z' sont 
strictement identiques). 

Les sequences predefines peuvent etre categorisees de la maniere suivante : 

• Representation des caracteres deja utilises dans la definition d'une constante. II s'agit de "\", de '"" 
et de " H ", le guillemet etant utilise pour delimiter les chaines de caracteres, comme nous allons le voir 
juste apres. 

• Representation de caracteres de controle : les plus utilises sont : 

"\n" (code ASCII 1 0.soit Line-Feed) pour newline, e'est a dire le passage au debut de la 
ligne suivante. 

V (code ASCII 13, soit Carriage-Return) ; il permet de revenir au debut de la ligne 
courante. 

"\t" (code ASCII 9, soit Horizontal-Tab); e'est la tabulation classique. 

"\f (code ASCII 12, soit Form-Feed); e'est le saut de page. 

"\b" (code ASCII 8, soit Backspace); permet de revenir un caractere en arriere. 

"\0" (code ASCII 0, soit Null); utilise pour materialiser la fin d'une chaine de 
caracteres. II s'agit d'un cas particulier du "V suivi d'un nombre octal, mais qui est 
probablement le plus utilise. 
II en existe quelques autres que vous trouverez dans la documentation du compilateur. 

• La sequence "\p" est specifique au GS et ne peut de plus s'utiliser qu'en premiere position d'une 
chaine de caracteres. Elle demande au compilateur de remplacer I'octet qu'elle occupe par la longueur de la 
chaine qui suit, afin de former une p-string utilisee par la ToolBox; cette p-string est limitee a 255 
caracteres. Dans les autres cas (emploi de cette sequence comme une constante d'un caractere ou ailleurs 
qu'en premiere position), la sequence est traitee comme un simple "p". 
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Chaines de caracteres 






Une constante chaine de caracteres est constitute d'une suite quelconque de caracteres entoures par des 
guillements """ excepte newline et le guillemet; ceux-ci etant represents par des sequences 
d'echappement telles qu'elles ont ete decrites ci-dessus. Une chaine de caracteres occupe une suite 
continue d'octets en memoire, a raison d'un octet par caractere, et elle est terminee par un octet a 0; sa 
longueur peut done etre quelconque sans la limite a 255 caracteres comme une p-string. 

Attention a ne pas confondre une constante caractere (par exemple Y) et une constante chaine de 
caracteres (par exemple "x"). Dans le deuxieme cas, la constante occupe 2 octets (un octet pour le x et un 
octet pour le de terminaison. De plus I'acces a la chaine de caracteres se fait au travers d'un pointeur, 
comme nous aurons I'occasion de le voir dans un prochain numero, alors que la constante caractere est 
directement representee. Une chaine vide se represente par """", mais elle occupe cependant 1 octet, 
celui du final; la sequence """ n'est pas valide en C. 

Comme la longueur d'une chaine de caracteres peut etre quelconque, cette derniere peut utiliser 
plusieurs lignes dans le programme source. Avant la norme ANSI, il fallait utiliser le caractere V suivi 
immediatement d'un retour chariot (attention, il ne s'agit pas de la sequence "\n") puis continuer la suite 
de la chaine au debut de la ligne suivante; cette methode presente I'inconvenient de casser Indentation du 
programme, car si Ton souhaite positionner la suite du texte au meme niveau d'indentation que la ligne 
precedente, les blancs inseres en debut de ligne sont pris en compte dans la chaine de caracteres, ce qui 
n'est certainement pas desire ! 

De plus, si un espace a ete ajoute juste apres le "\", le retour chariot suivi n'est plus traite comme 
continuation de la chaine, et la ligne suivante est prise comme une nouvelle instruction. Un exemple valant 
mieux qu'un long discours, voici comment on utilise ce mecanisme : 

printf ( "Hello, \ 
world. \n M ); 

Vous noterez que cela ne fait pas tres joli. Heureusement, la norme ANSI definit une nouvelle syntaxe 
beaucoup plus pratique : il suffit simplement d'accoler 2 constantes chaines de caracteres, chacune 
entouree de ses """, sans autre chose entre les 2 que des espaces, tabulations et retours chariot, 

comme : 



printf ( "Hello, " 

"worldAn" ); 

Ce qui est tout de meme nettement mieux ! Cependant, si vous utilisez APW C, il faudra vous contenter 
de la premiere methode. Encore un atout pour ORCA/C ;-) 

Nombres reels 



La definition d'une constante representant un nombre reel est similaire aux autres langages, 
notamment Pascal. Le format general est une sequence de chiffres, eventuellement suivi d'un point decimal 
puis d'une autre sequence de chiffres, puis d'un exposant materialise par le caractere "e" ou "E". 

Par exemple : 314.1 5926e-2. Une constante reelle est stockee sous le format etendu de SANE. C 
autorise I'utilisation des lettres T (ou "F") et "I" (ou "L") accolees apres le nombre pour indiquer 
respectivement que la constante represente un nombre flottant ou double; ces specifications sont cependant 
ignorees par ORCA/C qui represente toujours les constantes reelles dans le format etendu de SANE. 
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Symbolisation des constantes 
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ORCA/C permet de symboliser (c'est a dire de donner un nom) a une constante et ce de 2 manieres 
differentes : soit en utilisant I'instruction "#define", soit en utilisant "const". Le mot clef "const" fait 
partie des apports de la norme ANSI, et n'est done pas disponible avec APW C; cependant, les constantes 
restent encore generalement definies avec "#define". Nous verrons comment est utilise le mot clef 
"const" lorsque nous aborderons les definitions de types et de variables. 

II est fortement recommande de nommer ses constantes, car cela rend le programme nettement plus 
comprehensible, y compris a son auteur lorsqu'il doit le reprendre. 

Les evolutions sont aussi beaucoup plus simples, puisqu'il suffit de changer la definition d'une 
constante au lieu de chercher son utilisation partout dans le programme. 

Pre-processeur 



La commande "#define" n'est pas une instruction du langage C. En fait, elle fait partie d'un ensemble 
de commandes d'un composant appele "pre-processeur". 

Au debut du C, il s'agissait d'un programme separe qui s'executait avant le compilateur; aujourd'hui, 
il est integre dans le compilateur, mais son action s'effectue avant le travail de compilation. Dans le cas 
d'ORCA/C, il permet d'effectuer 4 types d'operations : 

• La definition de constantes et de macros (pour ces dernieres, nous verrons ulterieurement de quoi il 
s'agit) par la commande "#define". Cette commande permet d'associer un nom a une valeur (ou une 
expression) numerique ou chaine de caracteres. La definition peut elle-meme faire reference a d'autres 
symboles definis de cette maniere. Lors de I'execution du pre-processeur, celui-ci va remplacer toutes 
les occurences du symbole par la valeur associee. Le compilateur n'a done jamais connaissance de ces 
symboles. 

De ce fait, s'agissant de substitution textuelle, ces symboles n'ont pas d'existence dans le programme 
compile et n'occupent done pas de memoire, tout en permettant une utilisation symbolique des valeurs 
constantes. 

En revanche, elles ne sont pas examinables avec un debugger, et ne permettent pas au compilateur de 
faire des controles de type. La syntaxe prend la forme suivante (les crochets represented des espaces et 
des tabulations optionnels) : 

[]#[]define symbole expression 

Avant la norme, le symbole "#" devait etre en colonne 1, et le mot clef definissant Taction du 
pre-processeur devait lui etre accole. Ce n'est aujourd'hui plus obligatoire, mais cela permet de garder la 
compatibility avec des compilateurs plus anciens. Le symbole est un identificateur C defini par les regies 
precedentes; les conventions veulent qu'il soit en majuscules pour le differencier d'un identificateur 
normal reconnu par le compilateur, mais ce n'est nullement obligatoire, et c'est une convention rarement 
respectee sur le GS. L'expression doit suivre les regies de construction d'une expression C, que nous 
verrons dans le prochain article. 

Comme #define permet de faire de la substitution de texte, rien n'empeche de s'en servir pour 
redefinir par exemple les mots clefs et les symboles du langage, bien que je vous le deconseille fortement, 
afin de ne pas creer chacun son propre dialecte C. Ainsi, vous pourriez "pascaliser" le C en redefinissant 
certains symboles : 

#define begin { 
#define end } 
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etc ... Mais ce n'est plus du C ! et je ne pense pas que cela ameliore vraiment la 
lisibilite du programme. 

Nous verrons dans un prochain numero une autre forme de la commande #define permettant de definir 
des macros. 

• [.'inclusion de fichiers par la commande "#include". Elle permet d'importer les definitions d'un 
autre module dans un contexte de compilation separee; par exemple, la toolbox utilise ce mecanisme pour 
definir les constantes et les fonctions de chacun des toolsets. En theorie, et pour etre complet, le 
programme "hello. cc" du precedent article aurait du s'ecrire : 

#include <stdio.h> 

void main ( void ) 

{ 

printf ( "Hello, world\n" ); 

) 

Le fichier stdio.h contient toutes les definitions de la librairie standard d'entree/sortie du C, 
notamment la definition du prototype de "printf". 

Dans cet exemple, son inclusion n'est pas absolument indispensable, mais elle est souhaitable pour la 
clarte du programme. 

• La compilation conditionnelle. On entend par ce terme la possibility de compiler une partie du 
programme en fonction de la valeur booleenne d'une expression ou de la definition prealable (par #define) 
d'un symbole. Nous traiterons dans un prochain article de ce sujet. 

• Les directives de compilation par la commande "#pragma" completee par un nom de directive et 
eventuellement d'attributs. L'interpretation de cette commande varie avec chaque compilateur; par 
exemple ORCA/C utilise (entre autres) cette commande pour permettre au programmeur de lui indiquer le 
type du programme (normal, NDA, CDA). Pour plus d'informations, je vous renvoie a la documentation 
d'utilisation du compilateur, s'agissant d'un domaine trop specifique pour etre traite dans ces articles. 



w/ 
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Types et variables scalaires 



A la lecture de la syntaxe des constantes, vous devez deja entrevoir les types disponibles. Par type 
scalaire, on entend tout type de donnee elSmentaire (ou ordinal), par opposition aux types composites, 
comme par exemple les tableaux. 

C possede relativement peu de types scalaires, mais pour la plupart d'entre eux, il permet de leur 
associer un ou plusieurs attributs modifiant soit I'espace que les donnees de ce type occupent en memoire, 
soit le type d'espace qu'elles vont occuper (c'est ce que Ton appelle la "classe de stockage"), ou encore la 
maniere dont la variable est modifiable, ou enfin si elle est signee ou pas. 

Comme dans tout langage, C difference les variables globales (qui sont connues dans I'ensemble du 
programme) des variables locales (qui ne sont connues que dans la fonction qui les d6finit). Les variables 
globales sont done definies a l'ext§rieur de toute fonction (y compris la fonction "main" pr6sent§e dans le 
precedent article). En C, les variables globales ne sont pas necessairement definies avant la premiere 
fonction (bien que ce soit gen§ralement le cas pour des raisons de clarte); dans tous les cas, elles ne 
deviennent connues (et done referengables) qu'a partir de I'endroit ou elles ont £te definies (et sont done 
inconnues dans les fonctions prec§dant cette definition). II a ete dit plus haut qu'un programme C pouvait 
etre reparti sur plusieurs fichiers sources. Les variables globales peuvent §tre globales soit a I'ensemble 
du programme, soit etre restreintes aux fonctions du fichier source dans lequel elles ont ete definies; ceci 
permet d'implementer une veritable notion de module. 

Essentiellement la declaration d'une variable scalaire se presente de la maniere suivante (les zones 
entre crochets sont optionnelles, sachant que I'une de celles precedent le nom de la variable doit etre 
presente) : 






[classe-de-stockage] [caracteristiques ...] [taille] [type] nom-variable 
[= valeur-initiale] [, variable [= valeur-initiale] ...] 

J'espere que vous n'etes pas noy§s ! Chacun des Elements precedents a la signification 
suivante (I'ordre ci-dessous n'est pas celui dans lequel ces elements doivent apparaitre; il a 6te choisi 
pour la clarte des explications) : 

• Un nom de variable reprend la syntaxe d'un identificateur donnee plus haut; 
je ne reviendrais done pas dessus. 

• Les types de base sont tres peu nombreux puisqu'il n'y a que les entiers, les reels, les pointeurs 
(que nous traiterons dans un prochain article), et pour les compilateurs a la norme, les enumerations et 
un type special. 

Le type entier est defini par le mot clef "int", c'est le type par defaut d'une variable 
lorsqu'aucun type n'est specifie (ce qui n'est possible que si un des autres elements de la declaration d'une 
variable a 6te" utilise, notamment la zone taille). La taille d'une variable de type int depend de la machine 
sous-jacente; dans le cas du GS qui est une machine16 bits, un int occupe done 2 octets. Le champ taille 
permet de modifier la representation de la variable : il peut prendre I'une des 2 valeurs "short" ou 
"long" indiquant respectivement un entier de 2 (16 bits) ou de 4 (32 bits) octets. Vous noterez que dans 
le cas du GS, le type "int" est identique au type "short int" ou plus simplement "short". Comme le type 
int peut varier d'une machine a I'autre, et pour eviter de se poser des questions, je vous conseille 
fortement de toujours declarer les variables entieres en utilisant les types "short" et "long". Par defaut 
le type int est signe, cependant vous pouvez explicitement declarer une variable entiere signed ou non 
signee en prefixant son type par I'un des 2 mots clefs "signed" et "unsigned". Sachez qu'il est souhaitable 
de declarer les variables non signees a chaque fois que c'est possible, car le code gSnSre" par ORCA/C est 
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plus efficace (du moins c'est ce que dit sa documentation). 

Vous avez sans doute remarque que je n'ai pas cite le type caractere comme type de 
base; en fait, il ne s'agit que d'une variante du type int, mais qui se declare cependant avec le mot clef 
"char" qui peut malgre tout stocker n'importe quelle valeur entiere sur 1 octet (soit de -128 a +127 si 
la variable est signee et de a 255 si elle ne Test pas). 

Contrairement aux autres types entiers, les variables declarees de type char sont non signees par 
defaut depuis ORCA/C 1.2 (elles etaient signees dans les versions anterieures), mais cela peut etre 
specifie explicitement avec les mots clefs "signed" et "unsigned" (notez que la plupart des autres 
compilateurs ont un type char signe par dSfaut; il peut done etre souhaitable de toujours indiquer le signe 
lorsqu'on utilise une variable de type char pour y stocker des entiers). 

Vous avez aussi sans aucun doute note que je n'ai pas parle de type booleen, ni decrit de 
constante TRUE et FALSE. La raison en est que ce type n'existe pas en C. Au contraire, toute variable 
entiere peut etre utilisee comme booleen, puisque C definit comme FALSE, et toute autre valeur comme 
TRUE. C'est pourquoi il est contraire a I'esprit de C de comparer explicitement un r§sultat booleen a une 
6ventuelle constante TRUE dSfinie a 1, car rien ne garantit qu'une fonction va retourner une telle valeur. 
En revanche, revaluation d'une expression booleenne donne toujours un resultat de 1 si elle est vraie 
et de dans le cas contraire, ce qui permet de I'utiliser dans une expression arithmetique (comme au bon 
vieux temps de I'AppleSoft ;-). 

II existe enfin un type entier un peu special, appele "comp" et qui occupe 8 octets. Ce 
type est defini par SANE et est done specifique au GS (et accessoirement au Mac). Le compilateur ORCA/C 
les traite d'ailleurs dans la meme categorie que les nombres reels, puisqu'il doit passer par SANE pour les 
manipuler. 

Les variables reelles sont declarees grace a 3 mots clefs representant chacun une des 
failles et precisions possibles; il s'agit de "float" occupant 4 octets, de "double" necessitant 8 octets (qui 
peut aussi §tre precede par "long", sans que cela ne change quoi que soit) et de "extended" qui requiert 10 
octets. Je vous renvoie a la doc du compilateur pour plus d'informations sur les variables reelles. 

ORCA/C (et les autres compilateurs a la norme ANSI) definissent un type special (que 
nous avons deja aborde dans le premier article) appele "void" (vide en frangais). Ce type ne s'applique 
qu'a la declaration des fonctions, ou pour definir un pointeur generique; nous en parlerons done plus en 
detail lorsque nous aborderons ces sujets. 






, 



Le type enumere est presque equivalent a son homologue Pascalien, avec cependant 
beaucoup plus de libertes, puisqu'il n'y a aucun controle. 

Une variable de ce type est declaree avec le mot clef "enum". Ce type permet de definir une liste de 
constantes entieres et dont la variable de ce type peut prendre I'une d'entre elles a un instant donne. Ce 
type est identique a la definition de constantes par #define, la premiere constante de la liste prenant la 
valeur 0, et les suivantes les nombres successifs; il est aussi possible d'affecter une valeur donnee a un 
des symboles, ceci r£initialisant le compteur a cette valeur pour les symboles suivants. II est possible 
d'utiliser des valeurs negatives ou plusieurs fois la meme valeur pour des symboles differents. A 
I'execution, les variables enumerees peuvent etre librement melangees avec d'autres variables entieres, 
et on peut meme leur affecter des valeurs en dehors de celles definies dans la declaration. 

• II est possible d'associer une valeur initiale a une variable lors de sa declaration. 

Cette valeur pourra etre modifiee lors de I'execution de la fonction, sauf dans le cas ou il s'agit d'une 
constante, auquel cas la valeur initiale devra etre imperativement specifiee. 

• La classe de stockage (si elle est presente) peut etre I'un des mots clefs suivants : 

"auto" (pour automatique); cette classe s'applique uniquement aux variables locales 
Chapitre 2 page 9 



Initiation C - Chapitre 2 
d'une fonction, dont c'est d'ailleurs la classe par d6faut, si aucun mot clef n'est sp§cifie. Cette classe 
signifie simplement que la memoire requise pour le stockage de la variable doit etre allouee au debut de la 
fonction (ORCA/C reserve de la place sur la pile pour ces variables) puis liberee lorsque cette derniere se 
termine; par consequent, la valeur de ces variables est perdue d'un appel a I'autre de la fonction. 

"register"; cette classe s'applique aussi uniquement aux variables locales. Son but est 
d'indiquer au compilateur d'utiliser de preference un registre du microprocesseur pour stocker la 
variable associee, en general parce qu'elle va etre utilised tres frequemment. Comme le 65816 ne dispose 
que de tres peu de registres, cette classe est ignore et traitee de la meme maniere que "auto". Dans un 
contexte plus general, les compilateurs C actuels sont optimisants, c'est a dire qu'ils sont capables de 
determiner automatiquement quelles sont les variables a stocker dans les registres disponibles, sans qu'il 
soit necessaire de leur indiquer; cette classe reste done a titre de compatibility historique. 

"extern"; cette classe signifie simplement que la variable ne doit pas etre definie ici, 
mais qu'elle Test quelque part ailleurs dans le programme, et que Ton souhaite y faire reference. Cette 
classe de stockage ne peut bien entendu s'appliquer qu'aux variables globales, puisqu'elle permet de 
r6ferencer des variables qui survivent a I'exScution d'une fonction. C'est d'ailleurs la classe de stockage 
par defaut de ces variables. 

Cependant, la presence ou I'absence du mot clef a une signification differente : si il est present, on 
reference une variable globale, tandis que si il est absent, on definit cette variable, ce qui n'est possible 
qu'une seule fois pour une variable donn§e pour un meme programme. Si une variable est dSclaree 
"extern" dans une fonction, cette variable globale ne peut etre referencee que dans cette fonction, tandis 
que si elle est declaree a I'exterieur de toute fonction, elle est accessible pour toutes les fonctions suivant 
sa declaration. Cette classe peut aussi s'appliquer a la declaration d'une fonction, avec les memes regies 
que pour les variables globales. 

"static"; cette classe a une signification differente, selon qu'elle s'applique a une 
variable locale ou globale. Dans le cas d'une variable locale, la classe static indique au compilateur que la 
valeur de la variable doit etre preservee entre les appels a la fonction dans laquelle elle a 6t6 d§claree. 
Dans le cas d'une variable globale ou d'une fonction, la classe static restreint la globalite au fichier source 
dans lequel cette variable ou cette fonction a ete definie, c'est a dire qu'une variable ou une fonction definie 
ainsi reste accessible globalement a l'inte>ieur du meme module (le meme fichier source) mais est 
invisible au linker, et par consequent aux autres modules (fichiers sources) du programme. Cela permet 
de realiser des librairies en garantissant que les variables globales internes de la librarie ne seront pas 
partagees avec les programmes utilisant cette librairie. 






^ 






"typedef"; bien que categorisee comme telle, typedef n'est pas a proprement parler une 
classe de stockage. En effet, il serf a d6finir de nouveaux types. Cependant, la syntaxe est identique a celle 
decrite precedemment, sauf que la liste des variables devient une liste de nouveaux noms de types, et que 
bien entendu, la zone "valeur initiale" n'a pas de sens. Typedef peut etre considere comme I'equivalent C 
de la commande #define du preprocesseur definie plus haut, en ce sens qu'elle permet de definir un 
synonyme a un type scalaire ou composite, eventuellement modifie par certains des attributs disponibles, 
et non pas comme la declaration de type du Pascal. 

• ORCA/C permet d'associer de fagon optionnelle I'une des 2 caracteristiques suivantes a la declaration 
d'une variable (celles-ci sont de par leur fonction mutuellement exclusives, bien que Ton puisse trouver 
les 2 dans la meme declaration, mais elles s'appliquent a des Elements differents — voir I'exemple 
ci-apres) : 

Le mot "const" permet d'indiquer au compilateur que la variable est en fait une 
constante, et qu'elle ne sera done pas modifiee par I'execution de la fonction (ce que le compilateur 
garantit en generant une erreur si ce n'etait pas le cas). Une valeur initiale doit etre imperativement 
donn6e lors de la declaration d'une constante. 
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Le mot "volatile" indique au compilateur que la variable ainsi designee peut etre 
modified en dehors du code dans lequel elle est definie, et done de fagon non identifiable par le compilateur. 
Ceci est utile si la variable est modifiee par exemple par une routine d'interruption ou s'il s'agit d'un 
pointeur sur I'un des softswitches comme le clavier. Le compilateur utilise cette information pour ne pas 
faire d'optimisations qui seraient contraires a I'effet desire. 

Les compilateurs C considered ces attributs comme des specifications de type, si bien que I'ordre dans 
lequel ils apparaissent par rapport au type lui-meme n'a pas d'importance (sauf dans le cas ou ils sont 
appliques a un pointeur sur une variable et non pas a la variable point6e), et qu'il est meme possible de ne 
specifier aucun type, auquel cas le type int est pris par defaut. 

Cependant, je vous recommande d'indiquer ces attributs avant le type de la variable et de toujours 
specifier ce dernier. 

Maintenant que nous avons fait le tour de la declaration d'une variable, voyons avant de terminer cet 
article quelques exemples concrets : 

int i; 

/* i est une variable entiere sur 16 bits 7 

short int i; I* la meme chose, mais il est preferable de le pr6ciser 7 

short i; 

/* toujours pareil, mais e'est la forme que je prefere */ 

unsigned i; /* entier court non sign§ */ 

unsigned short i; 

/* je trouve que cela est plus coherent 7 

long int j; /* j est une variable entiere sur 32 bits 7 

long j; 

/* e'est la meme chose, mais je trouve plus lisible 7 

unsigned long k = 10; /* entier long non signe et initialise a la valeur 10 7 

char c; 

/* un caractere 7 

signed char I = -3; /* un entier negatif stocke sur un octet valant -3 7 

extern short z; 

/* z est defini ailleurs, mais on en a besoin 7 

static long t; 

r si on est dans une fonction, la valeur de t doit etre 7 

r preservee jusqu'au prochain appel 7 

I* si t est une variable globale, ne pas I'exporter 7 

float f; 

/* pourquoi pas un nombre reel ? 7 

double d,e; /* et 2 doubles 7 

extended ex; /* et un etendu 7 

const extended pi = 3.141592653; /* pi est declare comme constante 7 

typedef int entier; /* definition du type entier 7 

entier var; /* et declaration d'une variable de ce type 7 

enum { rouge, vert, bleu } couleur; /* definition d'une variable enumer£e 7 

enum couleur { rouge, vert, bleu }; /* ici il s'agit d'une declaration de type 7 

enum couleur col; 

/* et d'une variable de ce type 7 
enum couleur couleur; 
/* on peut utiliser le meme nom 7 

typedef enum { false, true } boolean; /* definition d'un type booieen equivalent a celui de Pascal 7 
typedef enum { false = 0, true = 1 } boolean; /* la meme chose en forgant les valeurs de fagon 

compatible avec le C (ce sont aussi les valeurs normales)7 
volatile char * const kb = OxOOCOOO; /* declaration d'un pointeur constant sur une zone de 1 
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caractere qui est volatile (vous avez reconnu I'adresse du 
clavier) */ 

Et voila, vous savez quasiment tout sur la declaration des variables scalaires en C. Comme le montre le 
dernier exemple, cela peut parfois etre complexe (nous aurons Poccasion de voir des declarations pour 
lesquelles il taut son brevet lorsque nous traiterons des pointeurs; en fait je plaisante, car il existe des 
regies d'ecriture et done de lecture assez simples, et Ton peut encore ameliorer la lisibilite en utilisant 
des typedef sur les types intermediates; nous verrons tous ga dans le chapitre traitant des pointeurs). 

Dans le prochain article, nous aborderons la syntaxe des expressions permettant d'exploiter ces 
variables, que nous illustrerons par un petit programme. 

Forum C 



Dans cette section, nous traiterons des points particuliers que vous aurez souleves dans vos courriers. 

Les premieres lettres que j'ai regues me demandent de decrire I'environnement APW/ORCA et 
comment compiler et linker un programme. Je n'ai pas eu le temps d'aborder ce sujet pour cet article, 
mais dans le prochain numero de GSInfos (celui d'apres les vacances), vous trouverez un article repondant 
a vos demandes, en complement de celui sur les expressions. Continuez done a m'ecrire I 



— 
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Chapitre 3 



Resume des Episodes precedents 



Dans les chapitres precedents, nous avons vu les types de base disponibles dans le langage C, ainsi que la 
maniere de declarer des variables en leur donnant un de ces types, et enfin la syntaxe des differentes 
constantes et le moyen de leur donner un nom symbolique a I'aide du pre-processeur. 

Dans cet article, nous allons traiter des operateurs disponibles en C. Ces operateurs sont utilises dans la 
construction des expressions, lis sont principalement arithmetiques (ils s'appliquent done a des donnees 
numeriques, entieres ou reelles) et relationnels (ils servent a effectuer des comparaisons entre des types 
scalaires). 

C est caracterise par la grande richesse de ses operateurs. Ceux-ci couvrent en effet toute I'etendue des 
instructions de calcul offertes par la plupart des microprocesseurs, voire meme plus. La difficulty 
qu'eprouve le debutant vient souvent du fait que chacun est represents par un symbole special (ou une 
sequence de symboles), et non pas par un mot clef. De plus, la precedence (priorite) affectee a ces 
operateurs impose souvent ("utilisation des parentheses pour obtenir le resultat desire, ce qui ajoute a la 
complexity que Ton peut ressentir. 

Les detracteurs de C (les pascaliens en general) disent que le C est illisible, entre autre a cause des 
expressions utilisant ces operateurs. Je pense qu'il s'agit plutot de jalousie face a des possibilites qu'ils 
n'ont fait que rever. Par exemple, tous les operateurs de manipulation de bits n'existent pas en Pascal 
standard. Les 2 Pascals disponibles sur GS les ont implements en tant qu'extension, mais chacun de fagon 
differente : ORCA/Pascal utilise les memes operateurs que C, tandis que TML Pascal emploie des fonctions. 
Je ne parle meme pas des operateurs d'incrementation/decrementation ou d'affectation composee qui 
n'existent pas tout simplement. 

Operateurs arithmetiques 



II s'agit bien entendu des operateurs permettant d'effectuer les operations classiques que Ton retrouve 
dans tous les langages, a savoir I'addition, la soustraction, la multiplication et la division avec 
respectivement les symboles "+", "-", "*" et 7". Contrairement au Pascal, C ne dispose que d'un seul 
operateur de division qui donne soit un resultat reel, soit un resultat entier en fonction des operandes (il 
vous faudra faire une conversion de type explicite pour faire une division flottante avec des nombres 
entiers). C possede aussi I'operateur modulo permettant d'obtenir le reste d'une division entiere, a travers 
le symbole "%" (cet operateur ne peut done s'appliquer qu'a des operandes de type entier). 

Les operateurs V et "-" sont soit binaires (e'est a dire entre 2 operandes, afin d'effectuer une addition 
et une soustraction), soit unaires (e'est a dire immediatement devant une constante, de fagon a determiner 
son signe). 

La notion de nombre negatif n'existe pas pour un compilateur (que ce soit C ou un autre langage). Par 
consequent la presence du signe "-" et d'un nombre correspond a 2 entites : cela revient en fait a soustraire 
le nombre de 0. 
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II en est de meme pour I'operateur unaire "+", excepts que cela ne genere pas de code (c'est un NOP); on 
a done parfaitement le droit d'ecrire I'expression : a + +2, le premier "+" est I'operateur binaire, tandis 
que le second est unaire. Notez que le + unaire n'existe pas dans tous les langages; en I'occurence, il 
n'existait pas dans la definition originale de C. 

Les regies de precedence habituelles sont respectees, a savoir que "+" et "-" ont la meme priorite, mais 
qu'elle est inferieure a celle de "*", 7" et "%" (qui est identique pour ces 3 operateurs). Ainsi 
I'expression 3+4*5 vaudra 23 et non pas 35. Comme dans les autres langages, C permet de regrouper des 
operations entre des parentheses ("(" ")") afin de forcer I'ordre devaluation; dans I'exemple precedent, 
il aurait fallu ecrire (3+4)*5 pour obtenir 35. 

Les operandes sont automatiquement convertis de fagon a avoir le meme type, avant que I'operation soit 
effectuee. Par exemple, si un operande est entier et I'autre flottant, le nombre entier sera converti en 
flottant avant I'operation et eventuellement reconvert dans le type de la variable dans laquelle sera stocke 
le resultat. 

Si une soustraction est effectuee avec des nombres non signes, et que le premier est inferieur au second, le 
resultat sera la valeur non signee correspondant au nombre signe genere par le 65816, c'est a dire qu'on 
lui aura virtuellement ajoute 2 puissance la taille utilisee (8, 16 ou 32). 

Par exemple, la soustraction non signSe sur 16 bits 1 - 2 aura pour resultat -1 + 65536, soit 65535. 

Les debordements de capacite d'un calcul entier (soit signe, soit non signe) donneront lieu a un resultat 
qui sera modulo du nombre maximal representable dans la taille utilisee; en d'autres termes, les bits les 
plus significatifs seront perdus. Pour les nombres flottants, cela dependra du parametrage de SANE qu'il 
faudra faire par des appels directs. 

Operateurs d'affectation 






En C, I'operateur d'affectation (permettant de stocker le resultat d'un calcul dans une variable) est le 
symbole "=", contrairement a Pascal ou il sert a tester I'egalite entre 2 variables ou expressions. La 
raison en est que dans un programme normal, on effectue bien plus souvent une affectation a une variable 
qu'une comparaison; ceci permet done d'economiser de la saisie lors de I'edition du programme. 

Cet operateur peut etre utilise avec tous les operateurs arithmetiques precedents. Le resultat du calcul est 
eventuellement converti dans le type de la "valeur-g" de I'affectation. 

Notion de "valeur-g" et de "valeur-d" 



La notion de "valeur-g" (qui signifie "valeur-gauche"; notez que vous lirez plus souvent le nom anglais 
de "l-value" pour "left-value") et de "valeur-d" (vous aurez devine qu'il s'agit de "valeur-droite" ou de 
"r-value") existe dans tous les langages. Elle prend cependant une importance toute particuliere en C, du 
fait de ses operateurs. 

Ces 2 valeurs correspondent simplement a leurs positions respectives par rapport au signe "=" de 
I'affectation. La notion de "valeur-g" est la plus importante des 2, car elle conditionne I'utilisation d'une 
expression en tant que membre gauche d'une affectation. Toute expression legale en C est une "valeur-d". 

Une "valeur-g" est en fait une expression qui refere a I'adresse d'un objet. 
Par essence, toute variable simple est une "valeur-g", alors qu'une constante ou une expression 
arithm&ique ne Test pas : on ne peut pas ecrire a+b = ... 

(tous les operateurs decrits precedemment ne peuvent jamais donner une "valeur-g"). 



- 
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Un autre exemple est celui du tableau : un element d'un tableau est une "valeur-g" alors que le tableau 
pris comme un tout ne Test pas (on ne peut rien affecter a un tableau), il peut cependant etre une 
"valeur-r" dans certains cas. 

C possede des operateurs qui permettent d'obtenir une "valeur-g" comme resultat de revaluation d'une 
expression. Ces expressions correspondent en general a la manipulation des pointeurs, et seront done 
traitees en detail dans un prochain numero. 

Affectations multiples 



En C, le resultat d'une affectation peut lui-meme est affecte a une autre "valeur-g"; il peut done etre 
aussi considere comme une "valeur-r". Supposez que vous voulez initialiser les 3 variables a,b et c a 0. En 
Pascal, vous devriez ecrire : 

a := 0; 

b := 0; 

c := 0; 

En C, vous ecrirez plus simplement : a = b = c ■ 0; 

L'affectation a une associativity droite-gauche (au lieu de gauche-droite pour les operateurs 
arithmetiques precedents); ceci signifie que I'operation la plus a droite est evaluee en premier (ce qui 
parait assez logique). 

Une affectation intermediate peut aussi faire intervenir un calcul : par exemple, a=(b = c + d)*e; 
Dans cette expression, I'addition de c et d est stockee dans b, le tout est multiplie par e et stocke dans a. II est 
clair que ce genre de possibility peut conduire a I'illisibilite du programme quand elle est utilisee 
systematiquement et n'importe comment. Elle a neanmoins son utilite, notamment dans les macros. 



Affectations composees 



Vous avez peut etre remarque que j'avais ecris comme titre de cette section 'operateurs d'affectation' au 
pluriel. En effet, en plus de I'operateur d'affectation simple que Ton vient de voir, C permet de composer 
une affectation et une operation arithmetique dans un meme operateur (note : cette composition s'applique 
aussi aux operateurs de manipulation de bits que nous verrons plus loin). L'effet est d'appliquer I'operation 
specifiee entre la "valeur-g" et la "valeur-r", le resultat etant aussi une "valeur-r". Ces operateurs sont 
« += » ) «^« «'* = » i «i = « et "o/ 0= " vous aurez par exemple i += 5; ou i -= j * 7 / k; 

Ce qui signifie respectivement ajouter 5 a i et soustraire j*7/k a i. 

A priori, vous devez penser que cela ne sert pas a grand chose et qu'on aurait pu tout aussi bien ecrire 
i = i + 5; et i = i - j * 7 / k;. Ce n'est pas exact, car dans la premiere forme I'adresse de i n'est 6valuee 
qu'une seule fois, alors que dans la deuxieme, elle I'est 2 fois (certains compilateurs tres sophistiqu£s 
peuvent optimiser suffisamment pour supprimer la 2eme evaluation, mais ce n'est certainement pas le cas 
sur le GS). Dans ce cas precis, I'adresse de i peut etre obtenue rapidement, mais supposez que vous vouliez 
acc£der a un £l6ment d'un tableau et que vous ayiez une fonction permettant de calculer I'indice voulu; 

il est clair que e'est nettement plus performant de ne le faire qu'une seule fois. 

Concernant la lisibilite, je trouve qu'on voit ainsi clairement ce que Ton fait avec le membre gauche, ce 
qui n'est forcement le cas lorsqu'il est perdu au milieu d'une expression. 

Incrementation et decrementation 



C possede 2 operateurs permettant d'incrementer de 1 ("++") ou de decrementer (de 1 aussi) ("--" 
le contenu d'une variable, soit avant (pre-incrementation/decrementation), soit apres 
(post-incrementation/decrementation) revaluation de cette variable; e'est a dire que ces operateurs 
peuvent etre places avant ou apres la variable (ils ne peuvent done s'appliquer qu'a des valeurs-g), par 
exemple ++i; ou j-;. Dans le premier cas, i est increments et e'est cette valeur qui sera rendue, tandis 
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que dans le deuxieme cas, j donnera sa valeur, puis sera d§cr6mente. Cela ne prend son sens que si i et j sont 
utilises dans une expression plus complexe ou que leur valeur est affectee a une autre variable (sinon les 2 
operations sont identiques). Par exemple avec k = i++; k prendra la valeur de i qui sera ensuite 
increments. Avec I = --j; j sera d'abord d6cr6mente et le r§sultat sera affecte a I. 

Les pascaliens m'objecteront que Ton aurait pu 6crire tout aussi bien : 

k = i; 

1*1 + 1; 

i = j; 

pour arriver au m§me r6sultat. En dehors du fait que c'est nettement plus fastidieux a ecrire (pour ne pas 
dire lourd), le code gen6re n'est pas exactement le meme, du fait que la plupart des microprocesseurs ont 
des instructions decrementation et de decrementation, et qu'il faut deja un bon optimiseur pour 
reconnaitre cette operation et utiliser ces instructions. Ainsi, on aurait dans cet exemple : 

Dans le premier cas : 
Ida i 
inc i 
sta k 

^ dec i 

Ida j 

sta I 

Dans le second cas : 

Ida i 

sta k 

Ida i 

clc 

adc #1 

sta i 

Ida j 

sec 

sbc #1 

sta j 

Ida j 

sta I 



. 



Dans un cas aussi simple, I'optimiseur de Byte Works est capable de generer le code du premier cas, en 
utilisant la sequence du deuxieme. Rien ne garantit cependant que cela sera le cas dans des situations 
beaucoup plus complexes. 

Enfin, je trouve qu'une fois qu'on en a pris I'habitude, ces operateurs n'entravent en rien la lisibilite du 
programme, bien au contraire. 

Operateurs relationnels 



Les operateurs relationnels se classent dans 2 categories : les operateurs permettant d'effectuer des 
comparaisons et les operateurs logiques. 
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Operations de comparaison 
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C possede les 6 operations de comparaison classique, a savoir : 

egal 
!= different 

<= infSrieur ou 6gal 

< inferieur 

>= sup^rieur ou egal 

> sup6rieur 

C ne poss6dant pas de type boolean, une operation de comparaison donne un r§sultat num6rique qui est 1 
lorsque la comparaison est positive et lorsqu'elle est negative. Cette valeur (qui n'est pas bien entendu 
une valeur-g) peut etre utilisee dans une expression arithmetique, comme au bon vieux temps de 
PAppleSoft. Par exemple, i = j + ( k < I ); 

II taut faire attention entre l'op§rateur d'affectation "=" et l'op6rateur de comparaison "==", car les 2 
ont une valeur et peuvent done etre utilises dans les memes conditions. Par exemple, avec I'instruction de 
test "if" (que nous verrons en detail dans le prochain numSro), 

les 2 syntaxes "if ( a = b )" et "if ( a == b)" sont legales bien que n'ayant pas du tout le meme effet; 
dans la premiere b est affecte a a et la condition est vraie si b est non nul, tandis que dans le deuxieme, la 
condition n'est vraie que si a et b sont 6gaux. Cette ambiguite" est a I'origine de beaucoup de bugs, meme chez 
les pros, car on n'est pas a I'abri d'une faute de frappe. 

Operateurs logiques 



C possede les 3 operateurs logiques classiques and "&&", or "||" et not "!". 

Le point le plus important les concernant est que && et || sont toujours evalues de gauche a droite et que 
revaluation s'arrete des que la verite de I'expression est determined. Par exemple, si on a "a < b && c > d", 
la deuxieme expression ne sera pas evalu§e si la premiere est fausse; si I'operateur || avait ete utilise, la 
deuxieme expression n'aurait pas §te" 6valu§e si la premiere avait §te" vraie. 

Notez que cela a I'air normal, mais ce n'est pas necessairement vrai dans tous les langages. Par exemple, 
la norme Pascal indique que toutes les expressions doivent etre §valuees lorsqu'on n'utilise pas I'option 
d'optimisation afin d'exercer les differents cas de figure. Dans le cas d'ORCA/Pascal, revaluation de toutes 
les expressions est effectuee systematiquement. Dans f'exemple precedent, cela n'a pas d'importance, mais 
des que vous faites intervenir des pointeurs, vous devez complexifier votre programme inutilement, et on se 
demande alors lequel est le moins lisible ;-) 

Par exemple en C, vous pouvez ecrire en toute confiance "if ( ptr != NULL && *ptr ... )" 

En Pascal, il vous faudra 6crire : 

IF ptr o NIL THEN 

IF ptr A ... THEN - 

si vous ne voulez pas vous exposer a un plantage dans le cas ou le pointeur est vraiment NIL. La future 
norme "Pascal etendu" en cours d'etablissement prevoie les 2 operateurs AND_THEN et OR_ELSE pour 
forcer I'arret de revaluation; on pourra alors ecrire : IF PTR o NIL AND_THEN ptr A ... THEN. 

L'op§rateur "!" est la negation. II convertit done son op6rande soit de en non-zero, soit le contraire. On 
Putilise en general de la maniere suivante : 
if ( (variable ) 
a la place de 
if ( variable == ) 
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ce qui est pratique et clair lorsque la variable reprSsente un booleen. Dans d'autres cas, il peut etre 
souhaitable de faire une comparaison explicite pour ameliorer la lisibilite du programme. 

Expression conditionnelle 



C possede un operateur tres particulier; cet operateur est ternaire, c'est a dire qu'il requiert 3 
operandes, alors que les autres operateurs sont soit binaires (ils travaillent sur 2 operandes) soit unaires 
(ils ne travaillent qu'avec un seul operande). II est utilise pour executer une instruction de fagon 
conditionnelle. 

Prenons par exemple le cas du calcul du maximum de 2 nombres. Classiquement, on ecrirait : 

if ( a > b ) 

c = a; 

else 

c = b; 

En C, on peut aussi utiliser I'operateur "?:" pour parvenir au meme resultat. 

On ecrirait alors :c = (a>b)?a:b; (les parentheses ne sont la que pour ameliorer la lisibilite et ne 
sont pas necessaires, car la precedence de cet operateur est tres faible). 

En generalisant, on obtient "e1 ? e2 : e3"; I'expression e1 est d'abord evaluee, si elle vraie (non nulle), 
e2 est evaluee et donne le resultat de I'operation, sinon c'est e3 qui est utilisee. II faut bien voir qu'une 
seule des 2 expressions e2 et e3 est evaluee. e1 est une expression quelconque, done pas necessairement une 
comparaison. e2 et e3 doivent en general etre de types compatibles (une conversion de type pouvant etre 
effectuee si necessaire), puisque leur resultat sera utilise identiquement. 

Manipulations de bits 



C possede un jeu tres complet et tres puissant d'operateurs de manipulation de bits; ces operateurs 
peuvent etre utilises avec tous les types entiers. Ce sont : 

& et 

I ou inclusif 

A ou exclusif 

complement a 1 
« decalage a gauche 

» decalage a droite 

Les operateurs &, | et A effectuent I'operation correspondante bit a bit entre leurs 2 operandes 
(eventuellement apres conversion). L'operateur - inverse tous les bits de son operande. Les operateurs de 
manipulation de bits &, | et - ne doivent pas etre confondus avec les operateurs logiques &&, || et ! decrits 
precedemment. 

Par exemple 1 & 2 vaut 0, tandis que 1 && 2 vaut 1 (je vous laisse chercher pourquoi). 

L'operande de gauche des operateurs « et » est d§cale respectivement a gauche et a droite du nombre de 
bits indique par l'operande de droite. Par exemple x « 2 decale x a gauche de 2 bits et les remplace par des 
(c'est exactement la meme chose que si j'avais ecrit x * 4, excepte que cela ira nettement plus vite, etant 
donne que le 65816 a un operateur de decalage et pas de multiplication). 

Pour le decalage a droite, les bits decales sont soit remplaces par des si le nombre est non signe, soit par 
la valeur du bit de signe pour un nombre signe. 

Un decalage de bit est un NOP, tandis qu'un decalage d'un nombre negatif de bits est a prohiber, car le 
resultat est imprevisible. 
. 
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Un exemple de la puissance de C (pris dans K&R) : supposez que vous vouliez extraire n bits du nombre x 
(declare en unsigned int) a partir de p, sans connaitre a I'avance la taille de int (qui peut etre 16 ou 32 
bits selon la machine), et le tout ramene a droite. Vous pouvez ecrire : ( x » ( p + 1 - n )) & ~(~0 « n) 

La partie "x » (p + 1 - n)" deplace le champ desire a droite de rentier (on est sur que les bits decales 
seront remplaces par des en ayant declar§ x en unsigned). 

~0 genere un nombre ne contenant que des 1 (soit sur 16 soit sur 32 bits); 

-0 « n cree un masque contenant des sur les n dernieres positions et des 1 sur les autres; le 
complement a 1 inverse tout, soit un masque avec des 1 sur les n dernieres positions et des sur le reste; le 
& extrait enfin ces bits du nombre decale precedemment. 

Tous les operateurs binaires peuvent aussi etre utilises dans une affectation composee, sous la forme : &=, 
|=, A =, «= et »=. Par exemple c &= 0x7F permet de supprimer le bit de poids fort du caractere c. 

Conversions de types 



Lors de revaluation d'une expression, le type de chacun des operandes peut etre converti implicitement 
par le compilateur, soit pour les rendre compatibles entre eux, soit pour les rendres compatibles avec le 
type de la valeur-g qui recevra le resultat de I'affectation. Ces conversions sont decrites en detail dans le 
manuel du compilateur, et n'ont que peu d'interet pour une initiation. 

Vous pouvez aussi vouloir forcer la conversion de type de fagon explicite; ceci se fait en indiquant le nom 
du type entre parentheses "(type)" juste devant I'expression a convertir. Cet operateur s'appelle un 
"cast". Par exemple (long) ( i + 2 ) donnera un resultat sur un long plutot qu'un short si tel etait le type 
de i. Bien entendu, le tout sera reconverti en short, si le resultat est stocke dans une variable de ce type. Ce 
type de conversion explicite peut etre utile lorsqu'un resultat intermediate peut depasser la capacite d'un 
short, et que le resultat final tient dans un short, de fagon a eviter une troncation du resultat intermediate. 



Evaluation sequentielle 



C dispose d'un operateur (la ",") permettant de forcer revaluation sequentielle de plusieurs expressions. 
Le resultat de cet operateur est celui de la demiere expression evaluee. II permet d'ecrire par exemple : 
a = (b = c + d,e = b + f) + g; auquel cas a vaudra e + g. 

En fait, cette utilisation reste marginale, et est meme a decourager, car elle n'apporte pas grand chose, si 
ce n'est du pain aux d§tracteurs de C (il faut avouer que I'expression precedente n'est pas tres lisible). En 
revanche, cet operateur est tres utile (et tres utilise) avec I'instruction for, comme nous le verrons dans 2 
mois. 

II ne faut pas confondre I'operateur "," avec le separateur "," tel qu'il est utilise par exemple dans la 
declaration de plusieurs variables de meme type. 



Precedence des operateurs 



Chacun des operateurs que nous venons de voir est affecte d'une precedence permettant de determiner 
I'ordre dans lequel une expression les contenant sera evaluee. 

Chapitre 3 page 7 






w 



Le tableau ci-dessous resume cet ordre : 
Operateur 

* / % 
+ - 



&& 

II 
?: 

= += -= *= /= %= «= »= &= A = | = 
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AssociativiteQ 
unaire +unaire (type) 



gauche-droite 
droite-gauche 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
gauche-droite 
droite-gauche 
droite-gauche 
gauche-droite 



Note : cette table est incomplete, car nous n'avons pas encore vu les operateurs de manipulation de 
pointeurs. 

Les operateurs d'une meme ligne ont une precedence identique et sont evalues dans I'ordre indique dans la 
colonne associativity. Les operateurs d'une ligne ont une precedence superieure a ceux de la ligne inferieure. 
Les parentheses (qui ont la priorite la plus elevee) permettent de changer I'ordre devaluation. 



Conclusion 



Nous avons maintenant etudie les bases du langage C, et nous pouvons desormais mettre en ceuvre nos 
connaissances dans un petit programme. C'est ce que je vous propose dans le programme "nombres" que 
vous trouverez sur la disquette GS Infos. 

Ce programme a pour but de convertir un nombre dans sa forme textuelle (par exemple si vous saisissez 
123, le programme vous repondra cent vingt-trois). 

Meme pour un programme aussi simple, il a ete necessaire d'utiliser des elements du langage que nous 
n'avons pas encore vu. C'est pourquoi, je vous ai aussi mis le meme programme ecrit avec ORCA/Pascal (je 
vous laisse faire les adaptations eventuelles pour TML Pascal), afin que vous puissiez vous y retrouver (et 
comparer par la meme occasion entre les 2 langages !). 

La prochaine fois, nous continuerons notre croisiere a bord de C, en abordant les structures de controle du 
langage. 



w 
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chapitre 4 



Les instructions de controle 

Dans cet article, nous allons aborder les elements du langage qui permettent de commencer a construire 
des programmes. Vous en avez deja decouvert quelques uns dans le programme "Nombres" que je vous ai 
propose la derniere fois. Aujourd'hui, nous allons voir ce que j'ai appele plus haut les "instructions de 
controle". Avec ces elements, vous devriez pouvoir ecrire vos premiers programmes C ! 

Le langage C, qui a ete defini dans les annees 70, a, comme Pascal, ben&icie des principes de la 
programmation structure, et offre done toute la panoplie classique des instructions permettant de realiser 

• la sequence 

• I'alternative 

• I'iteration 



Notions d'expression et construction 



On dit que C est un langage depressions" (par opposition a Pascal qui est un langage d'"instructions"). 
Je vous rappelle qu'une expression en C est construite a partir des operateurs qui ont ete decrits dans le 
precedent GS Infos (ainsi que de quelques autres que nous traiterons ulterieurement). 

Cette terminologie se relere a l'el§ment de base du langage qui est I'expression pour le C, et I'instruction 
pour le Pascal (notez que Pascal est juste un exemple; pratiquement tous les langages de haut niveau sont des 
langages d'instructions). 

Une expression devient une instruction lorsqu'on la termine par le caractere ";". 

Si cette expression ne correspond pas a une affectation, ie resultat de son evaluation est perdu. Par 
exemple I'expression "i++" a 2 effets : le premier est d'obtenir la valeur actuelle de 'i', et le second 
d'incr§menter 'i'. 

En transformant cette expression en I'instruction "i++;", la valeur de 'i' est aussi obtenue, mais comme 
elle n'est pas utilised ensuite, elle est done ecartee. 

C'est la qu'est la difference fondamentale entre un langage d'expressions et un langage d'instructions (done 
entre C et Pascal) : dans le premier, le ";" termine I'expression et en fait une instruction, tandis que dans 
le deuxieme le ";" separe 2 instructions (c'est par exemple pour cela qu'il ne faut pas en mettre devant le 
ELSE, puisqu'il fait partie de la meme instruction que le IF correspondant). Notez bien la difference entre 
les 2 verbes "terminer" et w s6parer". 

Ainsi, une instruction C peut comporter plusieurs expressions (par exemple grace a I'operateur 
devaluation sequentielle "," que nous avons vu il y a 2 mois). Inversement, une expression n'est pas 
obligatoirement une instruction (par exemple, une affectation est une expression, sans etre necessairement 
une instruction), comme nous le verrons dans la suite de cet article. 
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Sequence 



Une sequence constructions est done ce qu'elle dit, e'est a dire simplement une suite destructions (sans 
Preiser s6par£es par ";", car celui-ci est partie int§grante de I'instruction). 

Blocs 



Un "bloc" (ou "instruction composSe") est une sequence d'instructions encadree par les caracteres 
accolades ouvrante "{" et fermante "}". 

Le ";" faisant partie integrante des instructions, la demiere instruction d'un bloc devra etre aussi 
terminer normalement. En revanche, le bloc n'etant pas une instruction, il ne doit pas y avoir de ";" apres 
la fermeture du bloc par "}". 

Un bloc est consider^ par le compilateur comme une instruction simple, et est done interchangeable avec 
elle. II est done possible de d§marrer un nouveau bloc n'importe quand, des lors qu'une instruction est 
autorisee par la syntaxe du langage, et pas uniquement a la suite d'une instruction de controle ou de la 
declaration d'une fonction. On peut ainsi avoir la sequence d'instructions suivante dans un programme : 

{ /* d§but d'un bloc 7 

instructions; 



{ I* d§but d'un bloc imbrique" */ 

instructions du bloc imbriqu6; 



} I* fin du bloc imbrique 7 

suite des instructions du premier bloc; 



} r fin du premier bloc V 

A quoi cela sert-il ? Pour que vous le compreniez, je dois vous devoiler la forme exacte d'un bloc, qui est 
la suivante : 

{ /* debut bloc V 

declarations; 

instructions; 

} /* fin du bloc V 

En effet, en C, on peut declarer des variables au d6but de chaque bloc (elles sont done locales a ce bloc), et 
non pas seulement au d6but d'une fonction. 

Bien Svidemment, e'est une possibilite qu'il faut employer avec parcimonie, et a bon escient, sous peine 
de rendre completement incomprehensible le programme. 

Mais en faisant bien attention, ceci permet dans un certain nombre de cas d'ameliorer la lisibilite du 
programme, et d'£viter de declarer une variable en permanence, alors qu'elle n'est utilisee que dans un cas 
bien precis. 
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Supposez, par exemple, que vous souhaitez permuter les nombres entiers 'a' et 'b' lorsque 'a' est plus 
grand que 'b'; vous pouvez ecrire le code suivant : 

if ( a > b ) { 
int temp = a; 
a = b; 
b = temp; 

} 

Note : J'ai ici combine" la declaration d'une variable dans un bloc avec la possibility de I'initialiser lors de 
sa declaration. 

Dans ce cas precis, il me semble plus clair de declarer la variable temporaire juste pour la permutation 
et non pas en permanence dans la fonction; ainsi, on n'a pas besoin de chercher ou elle est referencee. 
Remarquez que, dans cet exemple, le bloc est conditionne par I'instruction if, mais qu'il aurait tres bien pu 
etre imbrique simplement dans un autre bloc (sans instruction de controle prealable); je pense cependant 
que cette pratique est a decourager, et qu'il vaut mieux alors declarer les variables en tete de la fonction. 

Elle est neanmoins interessante dans la definition d'une macro; voir pour cela le programme 
d'accompagnement de cet article. 

Lorsqu'une variable est red6clar6e dans un bloc imbriquS (bien que ce soit possible, je ne saurais vous 
recommander cette pratique), elle masque la variable declaree dans le bloc externe, pendant la duree de 
validite du bloc dans lequel elle est red6claree, c'est a dire que lorsque Ton ressort de ce bloc pour executer 
I'instruction suivant I"'}", la variable masquee redevient active. 

Par exemple : 

{ 
short i; 

{ /* bloc imbrique 7 

char i; f redeclaration de i pour ce bloc avec un autre type */ 

} I* fin du bloc imbrique 7 

I* le premier i redevient actif 7 
} 

Toutes les classes de stockage sont disponibles. Par exemple, on peut declarer une variable statique dans 
un bloc imbriqu§; cette variable perdurera done apres la terminaison de ce bloc. Ceci revient exactement au 
meme qu'une variable statique locale d6claree en debut de fonction, sauf que la variable locale au bloc ne 
pourra etre utilisee que dans ce bloc (on dit qu'elle n'est visible que dans ce bloc). C'est bien entendu une 
h§r6sie, et il ne faut pas employer de telles methodes. 

Instruction vide 



Un ";" tout seul constitue une instruction vide, qui peut done etre utilisee partout ou une instruction est 
autorisee. Ainsi, en C, la sequence "...;;" est legale, bien que d'un interet limite (le premier ";" correspond 
a la fin d'une instruction, tandis que le second est I'instruction vide). De meme, si un ";" suit une "}", il 
s'agit en fait de 2 instructions differentes (la premiere etant un bloc et la seconde, une instruction vide), et 
non pas d'un ";" terminant I'instruction composee "{ ... }" (d'ailleurs certains compilateurs peuvent 
rejeter ces constructions; ORCA/C, lui, les accepte). 
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A quoi cela peut bien done servir, vous demandez-vous perplexes devant I'ecran de votre GS prefere\ Je 
vous rassure tout de suite, e'est tres utile, notamment avec les instructions que nous allons etudier juste 
apres dans cet article. 

Dans la suite de cet article, toute reference au terme instruction correspondra indifterement a une 
instruction simple, composee (un bloc) ou vide. 



Alternative 



Comme vous I'avez sans doute d6ja constate (par la lecture des articles precedents ou du programme 
"Nombres"), I'instruction de test est le "if" (comme dans pratiquement tous les langages). En C, cette 
instruction a la syntaxe suivante (dans sa forme la plus simple) : 

if (expression) instruction 

Notez que les parentheses sont obligatoires, et qu'elles deiimitent I'expression. D'autre part, il n'y a pas 
de mot clef "then"; les concepteurs du C ont en effet juge qu'il 6tait redondant, et qu'il ne faisait qu'alourdir 
les programmes. 

Vous remarquerez enfin que je n'ai pas mis de ";" apres I'instruction, puisque celui-ci en fait partie. 

L'expression est evaluee : si elle vraie (toute expression dont la valeur est differente de est considered 
comme vraie), I'instruction (qui peut etre composee ou vide, mais dans ce dernier cas, ga n'a vraiment 
aucun interet) est ex§cut§e. Dans le cas contraire (l'expression vaut 0), I'execution passe a I'instruction 
suivante. 

Remarquez que je n'ai nulle part indique" "expression conditionnelle" : l'expression n'a en effet pas 
besoin d'utiliser les opSrateurs de comparaison decrits dans le precedent GS Infos (pour m6moire, il s'agit 
de "==", de "!=", de "<", "<=", ">" et ">="). 

Nous pouvons done ecrire : if (variable) ... Si la variable est differente de 0, la condition est verified, et 
I'instruction execute; ainsi toute variable scalaire peut etre utilised comme boolean. C'est d'ailleurs une 
bonne pratique de ne pas faire de test explicite (== ou != 0) lorsque la variable represente un booleen. En 
revanche, lorsqu'elle represente un nombre, le programme sera plus clair avec un test explicite. 

Un autre exemple est celui d'une chaine de caracteres; je vous rappelle qu'une chaine C est une suite de 
caracteres terminer par un le caractere de code ascii (ecrit en general '\0') : on peut done ecrire "if 
(caractere) ..." pour determiner si Ton est en fin de chaine ou pas; personnellement, je prefere utiliser la 
forme "if (caractere != '\0') ..." qui me parait indiquer beaucoup plus clairement ce que Ton fait. 

ATTENTION : comme l'expression peut etre quelconque, elle cache un piege dans lequel 
on peut tres facilement tomber (meme quand on est un pro), et occasionner des heures de 
recherche du bug (car bien evidemment, lorsqu'on connait son programme, on ne voit 
jamais le bug qui est pourtant en plein en face des yeux). 

L'expression peut en effet etre une affectation; j'ai done tout a fait le droit d'ecrire "if ( a = b ) ...", ce 
qui affecte 'b' a 'a' et si 'b' etait non nul, provoque I'execution de I'instruction associee au if. 

Malheureusement, tres souvent, je voulais ecrire "if ( a == b ) ..." pour verifier I'egalite entre les 2 
variables, et une petite faute de frappe de rien du tout peut faire perdre un temps fou (ne rigolez pas, ga 
m'est bien sur deja arrive plusieurs fois). 

Cela fait partie a la fois de la puissance, mais aussi de la complexity de C, dont ses detracteurs raffolent. 
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Bien entendu, cette possibility est interessante dans un certain nombre de cas; par exemple si 'b' est en 
fait un appel d'une fonction ou un element de tableau, et que le test porte sur plusieurs valeurs de 'b'. Pour 
eviter de recalculer cette valeur (ce qui peut couter cher), on peut ecrire : 

if ( ( a = fct(parametres) ) == valeuM || a == valeur2) ... 

Comme I'ordre devaluation est garanti par le compilateur, cela evite de rappeler la fonction. Bien sur, 
j'aurais pu tout aussi bien ecrire a la Pascal ;-) : 

a = fct(parametres); 

if ( a == valeuM || a == valeur2 ) ... 

II est vrai que lorsqu'on debute, il est sans doute souhaitable d'employer cette deuxieme approche. D'un 
autre cote, je n'aime pas trop la prog ram mation en C a la maniere de Pascal (je dis ga dans un cas general, 
et pas specialement pour I'instruction precedente, les 2 formes sont egalement acceptables, et j'utilise 
indifteremment I'une ou I'autre); je trouve que cela alourdit inutilement les programmes. Comme toutes les 
bonnes choses, il faut en user, et pas en abuser. 

Lorsque vous voulez reellement faire une affectation dans un test (ou en fait dans n'importe laquelle des 
instructions de controle, puisque ceci est possible avec quasiment toutes), precisez le dans un commentaire 
ou ecrivez 

"if ((a = b) != ) ...". 

Forme generale 

Dans sa forme generale, I'instruction "if" se presente ainsi : 

if (expression) instructionl 
else instruction2 

L'instruction2 est executee lorsque I'expression est 6valuee a faux (c'est a dire a 0). 

Notez que, puisque le ";" fait partie integrante d'une intruction, il en faut 1 apres instructionl (done 
avant le else) lorsque celle-ci est une instruction simple. Attention, neanmoins, a ne pas en mettre apres 
une "}", car vous auriez alors 2 instructions (le bloc et I'instruction vide), et par consequent, le "else" ne 
se rapportera plus au "if (une erreur sera signalee par le compilateur, sauf si ce "if est imbrique et que 
le "if exterieur n'a pas de "else", mais votre programme serait tout de meme faux). 

Tests multiples 

L'instruction de tests multiples prend la forme : 

if (expression) instruction 
else if (expression) instruction 
else if (expression) instruction 
else instruction 

Le dernier "else" correspond a la situation "aucun des precedents", c'est a dire I'instruction a executer 
lorsqu'aucune des conditions n'est satisfaite. Si il n'y a pas besoin d'une telle instruction, alors il n'y a pas 
de "else" final (dans ce cas, on utilise souvent ce dernier "else" pour detecter une erreur et afficher un 
message approprie). 
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Imbrication des if 

Plusieurs instructions "if" peuvent etre imbriqu§es; il faut seulement faire attention que le "else" se 
rapporte toujours au dernier "if". Si Ton souhaite qu'il s'applique a un "if" de niveau sup£rieur, on 
emploie les d6limiteurs de bloc "{}". 

Par exemple, si vous avez : 

if (...) 
if (...)... 
else ... 

le "else" se rapporte au deuxieme "if" (le compilateur ne tient pas compte de votre indentation !). 
Pour qu'il se rapporte au premier, il faut Scrire : 



if (...) { 

if (...).. . 
} else ... 

Selections 



A la place d'une batterie de "if ... else if ... else", vous pouvez utiliser I'instruction de selection 
"switch", qui a la syntaxe : 

switch (expression-scalaire) { 
case constante : instruction 



default : instruction 



Un certain nombre de commentaires sont necessaires sur cette instruction : 

• L'expression assoctee a I'instruction "switch" doit donner un resulat entier (cela peut neanmoins etre 
aussi un caractere ou un 6numer§ qui sont considers comme des entiers). 

• En theorie, I'instruction switch est de la forme "switch (expression) instruction", mais dans la 
pratique, il s'agit toujours d'une instruction composed (un bloc), d'ou la presence quasi-obligatoire des 
"{}". Par consequent, on peut trouver des declarations de variables juste apres l'"{", mais elles ne 
pourront etre initialisers, sauf si elles sont statiques (("initialisation §tant faite au moment de la 
compilation/link). Bien Svidemment, je ne vous recommande pas d'utiliser cette possibility. 

• N'importe qu'elle instruction du bloc peut etre introduite par le pr6fixe "case" suivi d'une constante 
(ou d'une expression donnant une constante). 

Plusieurs "case" peuvent correspondre a la meme instruction. En revanche, chaque constante ne doit etre 
Iist6e qu'une seule fois. Le type des constantes doit etre le meme que celui de l'expression associee a 
I'instruction "switch", aux conversions de types automatiques pres. 

• L'6tiquette "default" permet d'introduire une s6rie d'instructions qui seront executees lorsque 
l'expression ne correspond a aucune des constantes listens par les differents "case". II ne doit aussi y avoir 
qu'un seul "default", mais il peut etre plac6 n'importe ou (done pas n§cessairement a la fin). 
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Cela a I'air bien complique, mais c'est en fait assez simple. Ce qu'il taut bien voir, c'est que les mots clefs 
"case" et "default" ne sont que des etiquettes, et non pas des instructions. En consequence, la serie 
d'instructions du bloc introduit par switch doit etre considere comme un tout, certaines de ces instructions 
sont simplement prelixees par une ou plusieurs etiquettes. 

Ainsi, si plusieurs instructions sont associees a la meme etiquette, cela ne constitue pas une instruction 
composee pour le "case" (puisque ce n'est pas une instruction), et il n'est done pas necessaire de les 
encadrer par des "{}" (encore que si vous le faites, cela n'aura aucune incidence, de par les vertus des 
blocs). 

Le fonctionnement est alors le suivant : 

• L'expression assoctee au "switch" est evalu§e. 

• On recherche dans instruction composed suivant le "switch" si il n'y a pas une etiquette "case" avec 
une constante correspondant a la valeur trouvee. 

• Si oui, on debute I'execution du bloc a I'instruction associee a cette Etiquette. 

• Dans le cas contraire, I'execution du bloc demarre a I'etiquette "default" si elle existe. Sinon, aucune 
instruction du bloc ne sera ex6cut§e, et le deroulement du programme se poursuit avec I'instruction suivant 
ce bloc. 

• L'execution se poursuit jusqu'a la fin du bloc, sans plus tenir compte des etiquettes "case" et "default" 
qui pourraient suivre. En Pascal, la rencontre d'un nouveau cas provoque la sortie de I'instruction "case". 
Ce n'est pas le cas en C. 

• Pour sortir du "switch", sans executer les instructions correspondant aux autres etiquettes "case" (ou 
"default"), on utilise I'instruction "break", qui effectue un branchement sur I'instruction suivant le bloc 
associe" au "switch" (on peut aussi utiliser les autres instructions de branchement de C, "goto" et 
"return", que nous verrons plus loin pour "goto" et dans un autre chapitre pour "return"). On obtient 
ainsi un comportement identique a celui de Pascal. 

Au niveau du GS (et en simplifiant), le compilateur construit une jump-table avec une entree pointant 
sur chacun des cas, puis il effectue un saut en indexant cette table par la valeur donnee par l'expression. 
Seule I'instruction "break" (ou la fin du bloc, bien sur) genere a son tour un branchement vers 
I'instruction suivant la jump-table. Du moins, ceci est le cas general, car si les differentes valeurs 
possibles de l'expression (done des "case") sont disparates (par exemple 1 et 10000), ORCA/C generera 
des comparaisons plutot qu'une jump-table qui aurait contenu 9998 entries se branchant vers 
I'instruction suivant le switch. 

Voyons tout cela sur un exemple : 



switch (i) { 






case 1 : . 


break; 




case 2 : . 


break; 




default : 


break; 


} 
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Une bonne habitude a prendre est de mettre un "break", bien entendu apres chaque cas, mais aussi apres 
le dernier. Ainsi, si vous avez besoin de rajouter un nouveau cas, vous n'aurez pas a penser a rajouter le 
break au cas qui devient I'avant dernier, et done d'6viter des surprises qui peuvent etre desagr§ables. 

D'un autre cote\ comme chaque constante ne peut etre prSsente qu'une seule fois, il est parfois necessaire 
de ne pas mettre de "break" entre 2 cas. Par exemple, si un cas doit effectuer un traitement supplemental 
a d'autres cas, on le met avant, on effectue ce traitement, puis on met les autres cas en dessous, sans les 
s§parer par break, le premier cas continue alors son execution avec les instructions communes. II est 
souhaitable de preciser par un commentaire que I'absence de "break" est volontaire. 

Voici un exemple typique de ('utilisation de ces differentes possibility (vous noterez que Ton peut sortir 
du "switch" par I'instruction "break" de fagon conditionnelle — a I'intSrieur d'un "if") : 

switch (c) { 

case 'V : f traiter les cas \n, \t ... 7 

if (caractere suivant == n || t ...) { 

break; 

/* caractere ordinaire precede par escape 7 
c = caractere suivant; 
/* on tombe dans le cas normal, d'ou pas de break 7 

default : /* traitement des caracteres ordinaires 7 



break; 



_, 



■ 
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Branchement inconditionnel 



C dispose de I'instruction "goto" (comme pratiquement tous les autres langages). Elle est cependant 
encore moins necessaire qu'en Pascal, car C possede naturellement des instructions de sortie et de poursuite 
de boucle sans utiliser aucun artifice, comme nous allons le voir par la suite (j'ai deja ecrit plusieurs 
dizaines de milliers de lignes de C, sans jamais avoir eu besoin de faire de goto). 

Le "goto" se fait a une etiquette qui a la syntaxe d'un identificateur et est suivie du caractere ":". Cette 
etiquette se rapporte a I'instruction qui la suit, et doit etre unique dans la fonction dans laquelle elle est 
utilisee. Le goto ne peut etre fait que sur une etiquette localised dans la meme fonction (on ne peut pas faire 
de branchement par goto d'une fonction a une autre). On peut en revanche effectuer un saut au milieu d'un 
bloc (le comble de I'horreur !), et ignorer notamment ('initialisation des variables locales a ce bloc si il y 
en a, avec tous les effets de bord que cela peut impliquer. Une Etiquette peut enfin etre declaree, sans pour 
autant qu'aucun goto n'y fasse reference. 

Je ne peux que vous recommander de bannir cette instruction inutile des maintenant. 

Ne croyez pas que je sois un fanatique de la programmation structuree (d'ailleurs, si je I'avais ete, 
j'aurais continue avec le carcan qu'impose Pascal plutot que de passer a la liberte du C), mais je pense 
n6anmoins qu'elle a quelques merites. 

L'utilisation du "goto" dans les langages modernes montre en general un probleme de conception du 
programme (les puristes appellent cela de la programmation spaghetti). 

Lorsque le probleme est clairement enonce, la solution s'ecrit toujours simplement, et il vaut mieux 
ecrire un ensemble de fonctions traitant chacune un de ses aspects, au lieu d'une m6ga-routine avec des 
tonnes de tests et de boucles imbriquees (3 ou 4 me parait constituer un maximum maintenable; de ce point 
de vue, le programme d'accompagnement de cet article est limite, mais personne n'est parfait :-). 

C'est dans ce dernier cas que revolution d'un programme se reduit souvent a faire des branchements dans 
tous les sens pour integrer les modifications. Au contraire, il est beaucoup plus facile de modifier une petite 
fonction pour traiter un nouvel aspect du probleme. II faut cependant faire attention a ce qu'une evolution ou 
une correction de bug ne vienne pas compliquer la fonction modifiee; bien souvent, lorsque cela se produit, 
il est souhaitable de repenser cette fonction et de la redecouper a son tour en sous-problemes plus petits 
(sur le GS, I'appel a une fonction ne coOte pas tres cher : quelques PUSH/PULL, un JSL, un RTL, et un 
reajustement de la pile et de la direct page). 

Je vous donne cependant un exemple, pour que vous voyez comment cela fonctionne : 

fonction ( arguments ) 



goto plusjoin; 

plusjoin : ... I* c'est ici que le goto se branchera */ 
} 
Branchements longs 



Le "goto" du C ne peut etre utilise que dans le contexte d'une seule fonction. 

Bien qu'il ne s'agisse pas d'une instruction, mais d'un couple de 2 fonctions de la librairie standard du 
langage (que Ton doit done trouver dans toutes les bonnes implementations dont ORCA/C), C permet 
d'effectuer un branchement de presque n'importe quel point du programme a presque n'importe quel autre. 
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Ces fonctions sont "setjmp" et "longjmp" : la premiere permet de definir un repere, vers lequel la 
seconde permettra de se brancher directement. Pour le programme, le saut sera materialise" par un retour 
de la fonction "setjmp"; la valeur retourn6e 6tant lorsqu'il s'agit de I'appel normal initialisant le 
mecanisme, et une valeur pass6e en parametre a "longjmp" autrement (bien entendu, si le programme 
utilise cette valeur, I'appel a "longjmp" ne devra pas utiliser la valeur 0). 

Plus haut, j'ai indique" 'presque' car le "longjmp" ne pourra etre effectue" que depuis une fonction qui est 
dans la sequence d'appel de celle ayant initialement appel§ "setjmp", sans quoi vous pouvez vous attendre a 
avoir un crash. 

L'utilisation typique de ces fonctions est dans un systeme de menus : la fonction proposant le menu 
principal appelle "setjmp" avant d'afficher le menu, et les fonctions traitant chacune des options (et qui 
peuvent avoir §te appelSes par un certain nombre de fonctions intermSdiaires), peuvent ainsi revenir au 
menu principal directement par "longjmp", par exemple en cas d'erreur ou sur commande sp§ciale (un 
'escape'). Neanmoins, je pense qu'il existe des manieres "moins sauvages" de parvenir au meme resultat 
sans utiliser ces fonctions; de plus, avec la programmation 6venementielle du GS, c'est d'un intSret assez 
limite. 

D'un point de vue pratique, et en sch§matisant, la fonction "setjmp" va memoriser dans la zone memoire 
qu'on lui passe en parametre (on peut ainsi avoir plusieurs "setjmp" en attente) ie pointeur de programme 
et celui de la pile de la fonction appelante. Le "longjmp" n'aura plus qu'a les restaurer, un RTL faisant le 
reste. 

C'est pour cela qu'il faut que la fonction faisant le "longjmp" doit etre dans I'arbre d'appel de celle ayant 
fait le "setjmp", de fagon a ce que son contexte soit toujours sur la pile. 



Les boucles (ou les iterations) 



C (comme Pascal) dispose de 3 instructions pour r§aliser des boucles; 2 d'entres elles sont d'ailleurs 
pratiquement Squivalentes dans les 2 langages, tandis que la troisieme, bien qu'ayant le meme nom, est 
beaucoup plus puissante que son homologue pascalienne. 

Tant que 

Commengons par la plus simple des 3 : le "while". Sa syntaxe a la forme suivante : 

while (expression) instruction; 

L'expression est 6valu§e, et tant qu'elle est non nulle (done considered comme vraie), I'instruction est 
ex6cut6e. Cette instruction peut etre simple ou un bloc ou une instruction vide. Cette derniere possibility est 
interessante dans un certain nombres de cas, notamment lorsque la totalite de Taction est realisee par 
l'expression conditionnant la boucle. Par exemple, supposez que vous souhaitez savoir si une touche du 
clavier a 6t6 enfoncee, vous pouvez utiliser I'instruction : 

while ( kbd < 127 ); 

L'exemple n'est pas tout a fait exact, mais il requiert des notions que vous ne connaissez pas encore. 
Disons simplement que "kbd" correspond a OxEOCOOO. 
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Pour que I'instruction soit executee une premiere fois, il taut que la condition soit initialement vraie 
(done que la premiere evaluation de I'expression soit differente de 0). Vous aurez constate que cette 
instruction fonctionne de fagon strictement identique a son homologue Pascal. 

Controle des boucles 



Deux instructions annexes sont tres utilisees dans le contexte d'une boucle, et 
servent a controler leur execution : 

• L'instruction "break", que nous avons deja rencontree, permet de sortir a tout moment de la boucle 
dans laquelle elle est employee; dans le cas de boucles imbriquees, elle ne permet de sortir que de la boucle 
interne, mais par un systeme de drapeau (flag), on peut cascader les "break" pour sortir de la boucle la 
plus externe. 

Le programme d'accompagnement de cet article en constitue un bon exemple. Si vous avez un "switch" 
imbrique dans une boucle, le "break" utilise pour terminer un "case" ne s'appliquera, bien entendu, qu'au 
"switch" et pas a la boucle englobante. 

On peut aussi bien sur utiliser l'instruction goto ... hum! 

• L'instruction "continue" permet, elle, de passer directement a la fin du bloc (et done de reevaluer 
I'expression pour le tour de boucle suivant), sans executer toutes les instructions intermediates. En gros, 
cela revient a faire un goto a une etiquette precedent immediatemment la fin du bloc. 

Pour synthetiser, voyons sur un exemple, a quoi correspondent ces 2 instructions : 

while (expression) { 

etiquette_continue: 

} 
etiquette_break: 

L'instruction "continue" correspond done a un branchement a "etiquette_continue", tandis qu'un 
"break" correspond a un branchement a "etiquette_break". 

Enfin, l'instruction "return" que nous traiterons dans le prochain numero, avec les fonctions, permet 
bien entendu aussi d'interrompre une boucle. 

Faire ... tant-que 

Dans certains cas, on veut pouvoir executer au moins une fois l'instruction a repeter. C dispose a cet effet 
de l'instruction "do ... while", dont la syntaxe est : 

do instruction while (expression); 

L'instruction est done exeutee au moins une fois, puis I'expression est evaluee : si elle vraie (non nulle), 
la boucle reprend; dans le cas contraire, I'execution se poursuit avec l'instruction suivant le "while". 

Vous remarquerez que I'expression est evaluee dans les memes conditions que l'instruction "while" 
decrite precedemment, la seule difference etant que l'instruction est executee au moins une fois. 

Cette instruction n'est done pas strictement equivalente au "repeat ... until" de Pascal, puisque cette 
derniere continue la boucle tant que la condition est fausse. 
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Cette boucle peut etre aussi interrompue pr§matur6ment par les instructions "break" et "continue" 
(ainsi que par "goto" et "return"). 

Pour 

L'instruction la plus puissante de C est, a mon avis, Instruction "lor". 

Dans la plupart des langages (Pascal en representant I'implEmentation la plus limitee), la boucle "for" 
permet de r6peter un certain nombre de fois, connu a I'avance, la ou les instructions associees, 
eventuellement avec un pas d'incrEmention ou de decrementation different de 1 (la limitation particuliere 
de Pascal vient du fait que le pas est obligatoirement de 1). 

Bien entendu, C permet de rSaliser cette operation. Cependant, la syntaxe du "for" C est telle que celui-ci 
peut etre utilise" dans bien d'autres occasions. 
Cette syntaxe est done : 

for (expressionl; expression2; expression3) instruction 

Les expressions peuvent §tre quelconques, et elles sont m§me optionnelles. En revanche, les ";" sEparant 
ces expressions sont obligatoires. 

Avant de detainer le fonctionnement du "for" (et de vous le rendre plus comprehensible), sachez qu'il est 
strictement Equivalent a la sequence destructions suivante : 

expressionl; 

while (expression2) { 

instruction 

expression3; 
} 

Le principe general est alors : 

• Expressionl (si elle existe) est evaluEe. En general, elle va consister a initialiser la ou les variables 
correspondant au compteur de la boucle (en se rEfErant au 'lor" des autres langages). 

• Expression2 est §valu§e. Si elle est vraie (non nulle), l'instruction associSe au "for" est exEcutee. 
Cette instruction peut etre un bloc ou vide, si le "for" se suffit en lui-meme; cela arrive tres 
frSquemment, voyez, par exemple, le programme d'accompagnement de cet article. Si l'expression2 est 
fausse, Pex6cution continue a la suite du "for", sans que expressions ne soit EvaluEe, ni l'instruction 
exEcutee. Si l'expression2 est absente, elle est alors considered systematiquement comme vraie, et la boucle 
devra etre interrompue, par exemple par "break". 

• Expressions est EvaluEe apres l'instruction, et est utilised g§n6ralement pour faire avancer le 
compteur de boucle. Le processus se rEpete avec la revaluation de l'expression2, puis I'execution 
eventuelle de l'instruction, et une nouvelle Evaluation de expressions, jusqu'a ce que la boucle se termine. 

L'exemple le plus classique de cette instruction est de la forme : 

for ( i = 0; i < nombre_de_repetitions; i++ ) ... 
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ou (ce qui revient au meme) : 

for ( i = 1; i <= nombre_de_repetitions; ++i ) ... 

Notez que Ton peut utiliser les 2 formes ^incrementation dans ce cas, sans aucune incidence sur le 
resultat. C'est juste une affaire de gout. 

L'exemple typique d'une boucle "for" se suffisant a elle-meme, c'est a dire avec une instruction vide, est 
celui de la recherche d'un element dans une table, ce qui donne : 

for ( i = 0; i < nombre_elements && elementj' != element_recherche; i++ ); 

Notez bien le ";" juste apres le "for", signifiant qu'il n'y a aucune 
instruction a repeter. 

A la fin de la boucle, "i" sera soit I'indice de I'element si il a ete trouve, soit le nombre d'elements en cas 
d'echec. En effet, contrairement a d'autres langages (tel Pascal), il n'y a pas a proprement parler de 
variable de controle de boucle en C, c'est a dire que, dans notre exemple, "i" a une valeur significative et 
utilisable a la fin de la boucle, et aussi qu'il peut etre modifie dans le corps de la boucle (voir le programme 
d'accompagnement pour un exemple). 

En Pascal, la variable "i" aurait ete 'reservee' pendant la duree de la boucle, et n'aurait done pu etre 
modifiee, ni utilisee apres la fin de la boucle. 

La valeur de "i" pourra aussi etre utilisee en cas d'interruption prematuree de la boucle (ce qui peut etre 
effectue, comme pour les autres types de boucle, par "break", mais aussi par "goto" ou "return"); ainsi 
l'exemple precedent aurait pu etre ecrit de la maniere suivante : 

for ( i = 0; i < nombre_elements; i++) 
if ( elementj == element_recherche ) 
break; 

if ( i != nombre_elements ) /* element trouve 7 

else /* element non trouve 7 



_ 



Les 2 types de construction sont egalement employes. En general, on peut considerer que lorsque les 
conditions d'arret de la boucle sont multiples ou que des traitements annexes a la simple recherche sont 
necessaires, il est preferable d'utiliser la deuxieme forme, tandis que pour une recherche simple, la 
premiere methode a I'avantage de la concision et de la clarte. 

Ce processus est done tel qu'il a ete represents en utilisant I'instruction "while". II y a cependant une 
difference enorme, qui justifie a elle seule toutes les possibility de cette instruction : si on utilise 
I'instruction "continue", on reprend avec la devaluation de expressions, tandis qu'avec un while, on ne 
peut continuer qu'avec expression2, a moins de coder une copie de expressions avant le "continue", ce qui 
alourdit le programme, et rend sa maintenance plus difficile (si cette expression doit etre modifiee, il 
faudra changer toutes ses occurences). 

Si les 3 expressions sont vides, on a alors la forme "for (;;)" qui signifie 'boucler indefinimment'; il 
faudra alors employer une des instructions d'interruption precedentes. 

Quand utiliser "for" plutot que "while" et vice-versa : disons que lorsque la boucle ne necessite pas 
d'initialisation ou de mise a jour d'une ou plusieurs variables, il n'y a aucun besoin d'employer le "for" et 
que le "while" convient parfaitement a cette situation. 
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En revanche, des que Ton rentre dans une boucle de balayage d'une liste d'elSments, dans laquelle on 
commence a initialiser un index sur le premier Element, et que cet index doit ensuite correspondre a chacun 
des elements, le "for" C montre ici toute sa superiority (notamment lorsque le pas decrementation est 
different de 1) : 

• II permet de localiser en tete de la boucle toutes les informations de controle, et done d'eviter a les 
rechercher dans le corps de la boucle, comme cela serait le cas avec "while". Ceci est particulierement 
important dans le cas de boucles imbriquees, ou il devient difficile de determiner ce qui se passe, lorsque le 
corps de la boucle est melange avec son controle. 

• Comme les expressions sont quelconques, un indice de boucle n'a pas a etre necessairement un entier, ni 
a subir une progression arithmetique. Nous verrons par exemple, lorsque nous traiterons les pointeurs, que 
I'instruction "for" est tres puissante pour balayer des structures chalnees. 

Bien entendu, on peut tout faire avec I'instruction "for". Encore une fois, la sagesse dicte de I'utiliser a 
bon escient, e'est a dire dans un contexte rep§titif, et non pas pour faire n'importe quoi. 

Une demiere remarque pour en terminer avec cette instruction; je vous avais dit la derniere fois que 
I'opGrateur "," etait surtout utilise avec I'instruction "for". Voici done comment : je vous rappelle que cet 
operateur permet de grouper deux expressions qui sont evaluees I'une a la suite de I'autre; par consequent, 
les differentes expressions constituant I'instruction "for" peuvent etre plusieurs expressions separ^es par 
ce fameux operateur ",". Cela sert surtout avec les expressions 1 et 3, par exemple, pour faire varier 2 
compteurs en parallele. 

Concretement, cela donne quelque chose comme : 

for ( i = 0, j = n; i < j; i++, j-- ) ... 

Conclusion 



Desormais vous savez tout sur les tests et les boucles de C. J'espere que vous commencez maintenant a 
voir tout ce que Ton peut faire avec ce langage. Dans le prochain GS Infos, nous continuerons notre croisiere 
a bord de C, avec tout ce qui concerne les sous-programmes, que Ton appelle fonctions. 

Programme d'accompagnement 



Je ne sais pas ce que vous en pensez, mais il me semble que Ton comprend mieux (notamment lorsqu'on 
aborde un nouveau domaine) quand on voit comment les concepts etudies sont mis en ceuvre dans la pratique, 
et dans notre cas, dans un vrai programme. 

Notez que ce n'est pas une chose facile pour moi; il faut que je trouve une idee qui permette de developper 
un programme fonctionnel (et interessant I), qui illustre tout ce qui a 6te aborde dans le texte de Particle, 
mais qui n'emploie pas des techniques que nous n'avons pas encore traite. 

Je pense y etre a peu pres arrive avec le programme de ce numero, qui montre quasiment tous les 
differents types de boucles et de tests possibles en C, mais qui utilise aussi des tableaux, que nous ne 
verrons que dans 4 mois (en general, les boucles sont souvent employees pour travailler avec des tableaux; 
il m'etait done impossible de faire autrement). 

Je ne sais pas si vous trouverez le programme que je vous propose interessant (dans les 2 cas, faites le 
moi savoir), mais bien que I'utilisateur soit passif, il rev§t un certain cote ludique. 
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Avez-vous deja entendu parler des "cryptarithmes" ? II s'agit d'un jeu de type casse-tete, dont le 
principe de base est de retrouver une operation arithmetique simple (addition, soustraction, multiplication 
ou division). Cette operation a subi une transformation litterale, c'est a dire que chacun de ses chiffres a ete 
remplace par une lettre. Les regies sont alors : 

• Un chiffre donne est toujours remplace par la meme lettre; 

• Une lettre donnee represente toujours le meme chiffre (la substitution est done bijective); 

• Aucun nombre ne commence par 0, et les accents n'ont pas d'incidence. 

• Bien entendu, une fois les chiffres retrouves, I'operation est exacte I 

Les lettres utilises torment en general des mots, et souvent l'op6ration sous forme de texte a aussi un 
sens (les difterents mots on un rapport entre eux). 

Le programme, que je vous propose done, s'appelle "Crypt". II permet de resoudre les cryptarithmes 
representant des additions de 2 operandes. Par simple transformation, il peut aussi resoudre des 
soustractions (en effet, si le probleme est a - b -> c, il suffit de soumettre au programme b + c -> a). 

Je vous donne ci-apres les 10 qui m'ont servi a mettre au point le programme (la plupart ont ete puises 
dans la defunte revue Jeux & Strategie). Vous pouvez vous amuser a essayer de les resoudre a la main, puis 
verifier le rSsultat avec le programme. 






SEND 


SPEND 


VACHE 


SUISSE 


DEUX 


+ MORE 


+ LESS 


+ CHEVAL 


+ SUEDE 


+ NEUF 


MONEY 


MONEY 


OISEAU 


BRESIL 


ONZE 


ROMEO 


TIGRE 


JOYEUX 


CALCUL 


SOLEIL 


+ JULIE 


+ LIONNE 


+ NOEL 


+ MENTAL 


+ SABLE 


AMOUR 


TIGRON 


LUCIEN 


ELEVES 


BIKINI 



~ 



II est possible que le programme ne marche pas avec d'autres cryptarithmes, mais il donne une solution 
correcte aux 10 precedents. Notez qu'il ne trouve qu'une seule solution, meme lorsqu'il y en a plusieurs. 

Plusieurs ameliorations a ce programme sont possibles (je vous les laisse en exercice si le cceur vous en 
dit) : 



• Trouvez toutes les solutions a un probleme. 

• R6soudre les problemes avec plus de 2 operandes. 

• R6soudre les problemes autres que I'addition. 
Deux remarques pour terminer : 

• Au debut du programme, vous verrez 2 definitions de macro avec parametres. Ceci permet de decrire 
une portion de code utilisee plusieurs fois, et de I'appeler comme si il s'agissait d'une fonction; cependant, 
I'appel de la macro est remplace par sa definition, ce qui est plus economique, en termes de performances, 
qu'un appel a une fonction. 
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Chacune de ces macros se presente sous la forme d'un bloc, ce qui permet de declarer une variable locale 
au bloc, et done a la macro. Comme pour une veritable fonction, les arguments de la macro seront substitues 
par les parametres utilises lors de son appel. Enfin, vous noterez la presence du "V a la fin de chacune des 
lignes delinissant la macro; je vous rappelle qu'il s'agit du caractere de continuation de ligne. II est rendu 
necessaire, car la definition d'une macro doit etre faite necessairement sur une seule ligne. 

• Les printf contiennent parfois des caracteres exotiques; il s'agit en fait de caracteres de controle pour le 
driver de la console (notamment la fonction "gotoxy" avec ces arguments), ce qui permet de realiser un 
affichage plus joli. 

La methode employee n'est pas tres eiegante; j'aurais du en effet utiliser des definitions de constante pour 
les codes de controle, et des macros pour les envoyer a I'ecran. Allez, je vous laisse le faire ... 



Nouvelles du front 



Une nouvelle version d'ORCA/C, la v1.3, est disponible depuis le mois de novembre (il en est de meme 
pour ORCA/Pascal qui passe en v1.4, et de ORCA/M dont la version 2.0 est desormais disponible). Les 
informations donnees dans I'article de presentation de ORCA/C, paru dans GS Infos 17, sont toujours 
valables. Cette version corrige avant tout certains des bugs des versions pr6c6dentes (il en reste encore !), 
notamment celui dont je vous avais parie la demiere fois, semble t'il; depuis le mois d'aout je suis 
malheureusement tombe" sur plusieurs d'entre eux, dont un qui m'a fait perdre plusieurs heures, et qui est 
corrig6 dans cette version. 

Cette version comprend neanmoins 2 nouvelles fonctionnalites (ORCA/Pascal integre les m§mes 
ameliorations) : 

• Une directive "cdev" permet de les realiser directement (e'etait deja possible avant, en faisant quelque 
peu attention), de la meme maniere qu'un NDA ou un CDA. 

• 2 drivers GS/OS (.PRINTER et .NULL) a installer dans le dossier *:SYSTEM:DRIVERS sont fournis sur la 
disquette systeme accompagnant les compilateurs. Le premier permet d'utiliser I'imprimante en mode 
texte, directement depuis un programme C ou Pascal. II suffit de faire un appel a la fonction "open" de son 
langage ou de GS/OS en donnant comme nom de fichier .PRINTER; toutes les ecritures suivantes sont alors 
redirigees vers I'imprimante. Notez que Ton n'a pas besoin d'etre sous le shell pour I'utiliser. Un CDA et un 
CDEV permettent de configurer le driver. 

Le driver .NULL ne presente d'interet qu'avec la fonction de redirection du shell, par exemple lorsqu'on 
n'est interesse que par le resultat final d'une commande, et pas par les messages intermediates (ceci est 
notamment utile dans les fichiers EXEC). 
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chapitre 5 



Les Fonctions 



Mea culpa 

< 

Avant d'aborder le theme de cet article, je voudrais faire un petit rectificatif. 

Dans le numero 16 de GS Infos, j'ai parle de la declaration des variables en C (il s'agissait de la deuxieme 
partie de I'initiation). J'ai commis une petite erreur dans la description des variables globales. J'ai en effet 
ecrit qu'en C les variables globales n'etaient visibles qu'a partir de I'endroit ou elles elaient definies dans le 
source. C'&ait vrai dans le langage C original, defini par Kernighan et Ritchie. Ca ne Test plus en ANSI C qui 
indique qu'une variable globale est visible pour toutes les fonctions du source, quelque soit I'endroit ou elle 
est declaree dans ce source. En general, cela ne fait pas une grande difference, car, comme je vous I'avais 
deja indique a cette 6poque, les variables globales sont souvent declares au debut du fichier source, a des 
fins de lisibilite. 

Je vous prie de bien vouloir m'excuser de cette petite erreur; le probleme est que je programme en C 
depuis tres longtemps, et que je n'ai pas releve" tous les changements que la standardisation a apportes. 
J'espere que je n'ai pas commis de bevue plus grave; en general, j'essaie de verifier ce que j'ai ecrit avec le 
manuel d'ORCA/C pour 6viter de telles erreurs, bien que celle-ci m'avait echappe jusqu'a ce que je lise 
recemment un article sur ce sujet; si tel etait malheureusement le cas, n'hesitez pas a me le dire, pour que 
j'apporte d'autres rectificatifs. 

Venons en maintenant au sujet de cet article. 
Introduction aux fonctions 



Tous les langages (meme I'assembleur) permettent au programmeur de dScouper son programme en 
plusieurs morceaux, de fagon a ce qu'il soit gerable, c'est a dire qu'on puisse notamment le faire evoluer et 
corriger les defauts le plus facilement possible. Ceci permet aussi de reutiliser ces morceaux d'un 
programme a un autre, et d'en masquer les details au reste du programme. 

Le terme general que Ton emploie pour designer ce decoupage est celui de routine ou de sous-routine. Une 
routine permet done d'isoler un ensemble destructions, effectuant une tache bien determinee du 
programme. II est souvent souhaitable que cette tache puisse etre ex6cut6e plusieurs fois ou dans des 
contextes legerement diffSrents. Une routine peut aussi necessiter les services d'une ou plusieurs autres 
routines pour effectuer son travail, et ce de fagon recurrente, c'est a dire avoir des sous-sous-routines. 

Une telle routine va etre identifiee par un nom. Le langage permet d'executer cette routine depuis 
n'importe quel point du programme, et done, en quelque sorte, de transferer I'execution du programme a 
cette routine; on d6signe ce processus par le terme (Tapper. Le programme appelle la routine en 
sp6cifiant son nom, et dans certains langages, en utilisant une instruction sp6ciale pour effectuer cet appel 
(par exemple, en assembleur, on va utiliser I'instruction JSR ou JSL). 
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Lorsque celle-ci a termine son travail, I'execution du programme doit reprendre la ou elle en etait restee 
au moment de I'appel a la routine, comme si elle representait en fait une instruction de base du langage; ce 
mecanisme est appele le "retour a I'appelant", ou de fagon abregee le "retour". 

Un programme est done capable d'appeler une routine, qui a son tour peut appeler d'autres routines (et 
eventuellement elle-meme, comme nous le verrons a la fin de cet article), et ce indefiniment, la seule 
limite etant definie par I'ordinateur sur lequel est execute ce programme. Les retours permettent de 
revenir successivement dans chacune des routines appelantes jusqu'au point de depart. 

Une routine peut etre appelee dans des contextes legerement differents, et done adapter son travail au 
contexte voulu; ceci est realise par un processus appele "passage de parametres", lesquels parametres 
indiquent a la routine sur quelles donnees elle doit travailler. De la meme maniere, lorsque la routine 
retourne a son appelant, elle peut lui deiivrer un "resultat" correspondant au travail effectue. 

Chaque langage utilise un nom different pour representer ce concept de routine; certains langages 
detinissent m§me 2 instructions selon que la routine retourne ou non un resultat a la fin de son execution. 
Par exemple, en Pascal, une routine ne retoumant pas de resultat est appelee "PROCEDURE", tandis que si 
elle retourne un resultat, on emploie le terme "FUNCTION". 

En C, il n'y a que des "fonctions" qui, en theorie, retournent toujours une valeur. Un mecanisme a 
cependant et§ ajoute dans les compilateurs ANSI pour indiquer quand il n'y a pas de resultat retourne. 
Comme le C est un langage econome, il n'y a pas de mot cle indiquant qu'une fonction est definie, le contexte 
permettant de le determiner automatiquement. 

En C, il n'y a pas non plus de concept de "programme principal", comme e'est par exemple le cas en 
Pascal. A la place, il y a une fonction qui a un nom predetermine; en I'occurence, elle doit s'appeler "main". 

En dehors de ce nom reserve, cette fonction se comporte comme toutes les autres fonctions d'un 
programme; la seule difference est que lorsqu'elle retourne a son appelant, le programme se termine, 
puisque I'appelant peut etre vu comme etant le programme qui I'a lance (par exemple le shell ORCA ou le 
Finder) ou plus g£n§ralement, on peut considerer que e'est le systeme. 

D'un point de vue pratique, le compilateur fait en sorte que la fonction "main" soit la premiere executee. 
Par exemple, dans le cas d'ORCA/C, le compilateur g6nere systematiquement (sauf si on utilise la directive 
"noroot" dans le source considers), un fichier ".root" qui initialise I'environnement, puis qui appelle la 
fonction "main"; lorsque celle-ci retourne a son appelant, le code ecrit dans le fichier ".root" reprend la 
main et remet les choses au propre, avant de quitter vers le systeme. Si le source correspondant ne 
comporte pas de fonction "main", ce qui est le cas lorsque Ton decoupe un programme en plusieurs fichiers 
sources, le fichier ".root" ne sert a rien; il est done souhaitable d'employer la directive "noroot" pour 
eviter sa generation. 

Pour les programmes 'speciaux', tels que les accessoires, il n'y a pas de fonction "main"; a la place, une 
directive sp6cifique du compilateur permet de generer un fichier ".root" different, ce fichier appelle 
cependant une ou plusieurs fonctions bien determinees, definies par la forme particuliere de ce programme. 

Declaration et definition 



Lorsqu'on parle de fonctions (ou plus generalement de routines, ceci s'appliquant a tous les langages), on 
doit distinguer les termes "declaration" et "definition". 
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Le second terme est utilise" lorsqu'on fait reference aux instructions la composant : on "definit" la 
fonction. En revanche, lorsqu'on indique au compilateur que Ton va utiliser une fonction, quelque soit 
Pendroit ou elle est delinie d'ailleurs (ce peut §tre dans le meme source, soit avant, soit apres I'endroit ou 
on ('utilise, ou bien dans un autre fichier source du programme, ou encore dans une librairie d'usage 
g6ne>al, comme par exemple la librairie standard), on "declare" cette fonction. 

La declaration d'une fonction se presente de la meme maniere que la declaration d'une variable ordinaire, 
sauf qu'elle peut etre faite automatiquement si on fait reference a une fonction dans une expression, et qu'on 
ne I'a pas declaree prealablement; la valeur retournee est alors considered comme etant du type "int". 

Toutes les declarations ulterieures, ainsi que la definition de cette fonction, devront retourner une valeur 
de ce type. II est done fortement recommande de declarer toutes les fonctions avant de les appeler, pour 
eviter ce genre de probleme. De plus, les compilateurs ANSI permettent de verifier la concordance entre la 
declaration d'une fonction et sa definition, et done d'§viter des erreurs. 

Notez, que contrairement au Pascal, une fonction n'a pas besoin d'etre definie avant d'etre utilisee, ce qui 
fait qu'il y a une distinction entre definition et declaration. Pascal nScessitant de definir toute procedure 
avant de I'utiliser, la declaration est faite implicitement par la definition. Par consequent aussi, C n'a done 
pas besoin de directive "forward" pour indiquer au compilateur que le corps de la fonction est apres sa 
declaration. 

Deux ecoles ont tendance a s'affronter : celle disant que les fonctions doivent etre definies avant d'§tre 
utilisees (comme en Pascal); dans ce cas, la fonction "main" se retrouve generalement a la fin du source. 
Les autres definissent les fonctions appelantes avant les fonctions appelees; la fonction "main" est alors la 
premiere definie. Personnellement, je n'ai pas de preference particuliere, et j'utilise indifferemment les 
2, bien que j'ai une certaine tendance a utiliser de plus en plus la premiere methode. L'interet est que dans 
ce cas la declaration est faite implicitement par la definition, et que Ton peut beneficier des controles 
effectu£s par le compilateur, lorsqu'on utilise la forme moderne, sans avoir a effectuer de declaration 
explicite. 



Definition d'une fonction 






La definition d'une fonction peut avoir lieu n'importe ou dans le source, a partir du moment ou on n'est 
pas deja en train de definir une autre fonction. 
En d'autres termes, il n'est pas possible d'imbriquer la definition des fonctions. 

La syntaxe generale est alors la suivante : 

type-resultat nom-fonction ( parametres ) 

{ 

corps-de-la-fonction 

} 

La declaration d'une fonction, similaire a celle d'une variable aurait la forme suivante : 

type-resultat nom-fonction ( parametres ); 

Notez la presence du ";" a la fin de la declaration, alors qu'il n'y en a pas pour une definition. De plus, la 
definition comprend une instruction composee correspondant au corps de cette fonction. 
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Chacune des parties de la definition peut etre absente, si bien que la definition minimale d'une fonction se 
reduit a : 



nom-fonction () 

{ 

} 

A priori, cela ne presente pas un grand interet, puisqu'il est Evident qu'une telle fonction ne fait 
strictement rien. En fait, cela est tout de meme utile lorsqu'on d£veloppe un gros programme, puisque cela 
permet de satisfaire le linker, et done d'executer correctement le programme, par exemple pour tester 
d'autres parties, sans pour autant necessiter I'ecriture de toutes les fonctions. 

Lorsqu'on ne specifie pas le type du resultat, celui-ci est pris automatiquement comme 6tant "int", et non 
pas, comme on pourrait s'y attendre, pour indiquer qu'il n'y a pas de resultat, et done correspondre a une 
procedure Pascal. 

Traditionnellement, le fait de ne pas indiquer de type de resultat pouvait aussi bien correspondre a un 
resultat de type int que pas de resultat du tout. 

Pour lever cette ambiguity les compilateurs modernes (et done notamment ceux respectant la norme) 
definissent le type "void" pour indiquer qu'il n'y a pas de resultat. II est aussi fortement conseille de 
toujours specifier le type du resultat, lorsqu'il y en a un, meme si e'est "int". Le type du resultat peut etre 
n'importe quel type valide en C (e'est a dire aussi bien un type predefini qu'un type spScifique), a 
I'exception d'une fonction ou d'un tableau, mais on peut retourner un pointeur sur ces 2 types (nous y 
reviendrons dans un article futur). 

ORCA/C dispose d'options speciales dans la definition d'une fonction : 

"inline" permettant de definir I'interface avec la boite a outils et "asm" permettant d'Scrire des 
fonctions en assembleur directement dans le source C. 

Je ne m'Stendrai pas plus ces options, et je vous renvoie au manuel du compilateur pour tous les details 
les concernant. 

La syntaxe generate precedente correspond en fait a 2 manieres de d6finir une fonction en C : la premiere 
correspond a la definition du langage par K&R et a tendance a devenir obsolete; la seconde est celle 
recommandee par la normalisation du langage par I'ANSI, et que Ton designe sous le vocable de "prototype". 
ORCA/C permet d'utiliser les 2 formes. 



Ces 2 formes ont un impact sur la fagon dont on declare les parametres de la fonction. Nous allons 
maintenant voir ces 2 formes. 

Declaration des parametres traditionnelle 



_ 



Dans cette forme, on declare les parametres en 2 temps : on liste d'abord leur nom dans la definition de la 
fonction, puis on indique leur types avant d'ecrire le corps de la fonction. Un exemple permettra d'y voir 
plus clair : 

type-resultat nom-fonction ( parametrel, parametre2 ) 
char parametrel; 
int parametre2; 

{ 

corps-de-la-fonction 

} 
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Le typage des parametres a done lieu sous la forme d'une declaration de variables qui seront considerees 
locales a la fonction. On ne peut cependant declarer que des variables correspondant aux parametres, e'est a 
dire ayant le meme nom. Bien entendu, il ne doit y avoir qu'une seule declaration de variable pour chaque 
parametre. On ne peut pas initialiser ces variables (encore heureux !), puisque ces variables prennent 
comme valeur initiale celle passee en parametre, ni les declarer autrement qu'en automatique ou dans un 
registre. En revanche, il est possible de ne pas declarer de variable pour un parametre, indiquant que 
celui-ci est du type "int"; encore une fois, cela ne me parait pas etre une bonne idee. 

Cette syntaxe permet aussi de declarer des types avant de commencer le corps de la fonction, ce que je ne 
peux que vous deconseiller. 

La declaration d'une fonction definie de cette maniere ne permet pas de specifier les parametres qu'elle 
attend. Par consequent, le compilateur ne peut pas verifier la concordance des types, ni meme le nombre de 
parametres passes a la fonction lors de son appel. Ceci n'est pas sans poser de problemes; en effet, I'une des 
sources d'erreur les plus frequentes en C (et done de plantage des programmes) vient du fait qu'un 
programme peut passer de mauvais parametres ou en nombre incorrect, sans que le compilateur ne voit 
rien. De plus, les conversions de type effectuees automatiquement sont predefines, et pas forcement en 
accord avec ce qui est attendu : par exemple, K&R specifie que tous les entiers (char, short et long) sont 
convertis en "int" (ce qui dans le cas du GS revient a etre un "short"), a moins que le nombre ne tienne pas 
sur 16 bits, ou qu'on a utilise un cas explicite. Si la fonction attendait effectivement un "long", vous 
imaginez ce qui va se passer ! 

Sur le GS, ce type de probleme se pose avec les fonctions de la boite a outils qui sont declarees de cette 
maniere (car elles sont fournies par Apple, dont le compilateur APW C ne dispose que de cette forme), et il 
est malheureusement tres facile de se tromper, par exemple, en passant un entier sur 16 bits la ou la 
fonction attend un entier sur 32 bits. 

Cette forme est done en train de devenir obsolete, au fur et a mesure de I'apparition des compilateurs 
respectant la norme ANSI C. Le plus gros apport de la normalisation par rapport au C original defini par 
K&R se situe au niveau de la definition/declaration des fonctions. La nouvelle forme de declaration des 
parametres est designee par le terme de "prototype". 



<^ 
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Declaration d'un prototype 



Un prototype permet de definir tres precisement le type des parametres dans la declaration de la fonction, 
et par la suite permet au compilateur de controler que les parametres passes lors de I'appel a la fonction 
concordent avec ceux qu'elle attend. 

Le prototype peut etre utilise a la fois pour declarer une fonction et pour la definir. En fait, cette methode 
est identique a celle requise par Pascal. 

Voyons comment on declare un prototype sur un exemple : 

type-resultat nom-fonction ( type-paraml paraml, type-param2 param2 ) 

{ 

} 

Le typage des parametres est done effectue dans I'entete de la fonction, et non plus a part, comme dans la 
methode traditionnelle. Le compilateur peut done verifier lors de I'appel a cette fonction que les parametres 
passes ont effectivement le bon type, et eventuellement faire les conversions appropriees, et non plus se 
baser sur des regies predefinies. II en profite aussi pour verifier qu'il y a bien le nombre de parametres 
requis. 

Lorsque la fonction n'attend pas de parametres, on doit utiliser le type void comme seul et unique 
parametre. Ainsi, le compilateur pourra interdire toute tentative d'appel a cette fonction qui passerait des 
parametres. 

L'utilisation d'un prototype oblige a declarer une fonction avant de I'appeler, ce qui peut etre fait si 
celle-ci est definie avant d'etre utilisee, ou en la declarant explicitement. Dans le cas contraire, le 
compilateur va enregistrer la fonction appelee comme utilisant I'ancienne syntaxe, et va signaler une 
erreur lorsqu'il va rencontrer la definition de cette fonction avec un prototype. 

ORCA/C dispose d'une directive "lint" que j'ai decrite dans le precedent GS Infos (dans I'article 
concernant la programmation de la calculatrice), et sur laquelle je ne reviendrais pas aujourd'hui. Cette 
directive permet de forcer l'utilisation des prototypes, de s'assurer qu'une fonction appelee a bien ete 
declaree avant et que le resultat de la fonction a bien un type explicite. Je ne saurais assez vous 
recommander d'utiliser cette directive systematiquement; cela permet de se simplifier sacrement la vie. Le 
seul probleme est qu'elle doit etre specifiee apres I'inclusion eventuelle des fichiers header de la boite a 
outils, autrement la declaration des outils provoquerait systematiquement une erreur. 

Vous aurez sans doute compris que je vous engage a n'utiliser que la forme prototypee de declaration des 
fonctions. Le plus simple est meme d'oublier qu'il existe une autre forme, d'autant plus qu'elle a disparu 
dans le langage C++. Notez d'ailleurs que le prototypage des fonctions en C est issu de C++. 

Lorsqu'on declare un prototype de fonction, il est possible de ne specifier que le type des parametres, sans 
leur donner de nom, comme par exemple : 

type-resultat nom-fonction ( type-paraml, type param2 ); 

Cette forme peut aussi etre utilisee dans la definition, mais cela ne presente aucun interet. 



^J 
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Passage des parametres 



Jusqu'a present, nous avons vu comment declarer une fonction et les parametres qu'elle attend. Nous 
n'avons cependant pas defini comment ces parametres 6taient passes lors de I'appel a une fonction, ni la 
syntaxe particuliere indiquant ce mecanisme de passage. 

En general, on distingue 2 m§canismes de passage d'un parametre a une fonction : 

• Le passage par "valeur" : ce terme specifie que Ton passe la valeur de 
la variable associee dans la fonction appelante. En quelque sorte, le 
parametre est une copie de la variable initiale. Ainsi, toute modification 
de cette valeur n'entraine aucun changement pour le contenu de la variable 
de depart. 

• Le passage par "reference" ou par "adresse" : ici, on passe la variable 
elle-meme et non son contenu. En general, cela se traduit par le passage de 
I'adresse de la variable, c'est a dire que le parametre et la variable 
pointent sur le m£me emplacement m§moire. Par consequent, toute modification 
du parametre change directement le contenu de la variable. 

Selon les langages, une seule ou les 2 methodes de passage de parametre sont offertes. Par exemple, Pascal 
dispose des 2 : le mot cle" VAR precedent la declaration d'un parametre indique que celui-ci sera passe" par 
reference; son abscence stipule qu'il sera pass6 par valeur. 

C ne dispose que du passage par valeur, sauf pour les tableaux qui sont toujours passes par reference, afin 
d'Gviter la recopie de I'ensemble du tableau, ce qui pourrait couter tres cher en termes de temps et de 
consommation memoire. 

Ceci ne signifie pourtant pas qu'il n'existe pas la possibility pour une fonction de modifier une variable 
d'une autre fonction (qui serait normalement passee par reference), sans pour autant recourir a une 
variable globale. 

Puisque le passage par r6f6rence consiste a passer I'adresse d'une variable, pourquoi ne pas passer 
explicitement cette adresse ? C'est la technique retenue en C, c'est a dire que le parametre en question devra 
etre declare comme un pointeur sur la zone voulue lors de la definition de la fonction, et que lors de I'appel a 
cette fonction, I'adresse de la variable sera passee (par valeur d'ailleurs I) et non la variable elle-meme. 

C dispose de I'operateur "&" (dont nous n'avons pas encore parle) pour obtenir I'adresse d'une variable, 
et de I'operateur "*" pour dereferencer un pointeur. Notez qu'a cause de ce mecanisme, il est quasiment 
impossible d'ecrire un programme C sans utiliser de pointeur. Histoire de se compliquer encore un peu plus 
la vie, lorsqu'on veut passer un pointeur par reference, on doit aussi passer son adresse, creant ainsi une 
double indirection. On peut ainsi arriver jusqu'a des pointeurs triples; rassurez-vous, je n'ai encore 
jamais vu de quadruple indirection. On s'en sort bien souvent en utilisant des definissant des types sur les 
pointeurs intermediaires. 

Pour cet article, je n'en dirai pas plus sur les pointeurs, car ce sera le sujet de la septieme partie de 
I'initiation. 

Attention I le manuel d'ORCA/C comporte une erreur : il indique en effet qu'une structure ou une union 
(nous les traiterons dans le prochain article) sont aussi passees par reference, ce qui est faux ! Elles sont 
passees par valeur. 
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D'ailleurs, bien souvent pour eviter leur recopie (notamment lorsqu'elles commencent a avoir une 
certaine taille), on pr6f6re les passer par reference explicitement, meme si on n'a pas I'intention de les 
modifier. 

On peut indiquer ce cas au compilateur en prefixant la declaration du parametre par le mot cle "const". 
Par exemple : 

type-r6sultat nom-fonction ( const type-paraml *param1 ); 

Cette syntaxe peut aussi etre utilised lorsque le parametre est un tableau, qui, je vous le rappelle, est 
toujours passe par reference, lorsqu'on n'a pas I'intention de le modifier. 



Valeur retournee 



Lorsqu'une fonction souhaite retourner une valeur a son appelant, elle doit utiliser I'instruction 
"return" suivie de I'expression permettant d'obtenir la valeur desiree. 

Normalement, il n'est pas necessaire de mettre la valeur (ou I'expression) retournee entre parentheses, 
contrairement aux autres instructions de controle. 

J'ai neanmoins pris cette habitude depuis que je programme en C. Ne vous etonnez done pas si vous trouvez 
toujours des parentheses pour les "return" dans mes programmes, et pas dans dans ceux que vous pourrez 
voir par ailleurs. 

Si la fonction ne retourne pas de valeur, la fin de la fonction (e'est a dire du bloc correspondant) constitue 
un "return" implicite. C'est vrai aussi si la fonction est censee retourner une valeur, mais cela devrait 
etre indique comme une erreur. 

Les puristes de la programmation structuree disent qu'une fonction ne doit contenir qu'une seule entree et 
qu'une seule sortie, c'est a dire qu'un seul "return" en fin de fonction. Le Pascal leur donne raison, 
puisqu'il n'y a pas moyen de faire autrement, sauf sous la forme d'une extension du langage, qui prend une 
forme differente selon les implementations. 

Je ne suis pas d'accord I Bien entendu, il ne taut pas retourner a tort et a travers, mais il me semble 
preferable d'eliminer immediatemment les cas pour lesquels les conditions d'appel de la fonction ne sont pas 
satisfaites, afin d'eviter une imbrication de tests, qui, a mon avis, alourdissent inutilement le code. C'est, 
par exemple, la methode que j'ai employee dans la calculatrice, et elle ne me semble pas 'barbare' ! 

Semantique de passage 



C, contrairement a tous les autres langages, passe les parametres dans I'ordre inverse de leur declaration, 
c'est a dire de droite a gauche. En general, cela n'a pas d'importance, mais ca interdit cependant d'appeler 
une routine ecrite dans un autre langage qui ne respecterait pas ces conventions. ORCA/C permet d'indiquer 
qu'une fonction doit utiliser les conventions de passage des parametres des autres langages en prefixant la 
declaration de la fonction par le mot cl6 "pascal". 

Par exemple : 

extern pascal type-resultat nom-fonction ( type-paraml paraml, type-param2 
param2 ); 
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Bien que le mot cle soit "pascal", cela ne restreint pas le langage Stranger a etre le Pascal. Cette option 
doit aussi etre utilisee lorsque la fonction C est appelee par de I'assembleur, par exemple par la boite a 
outils, ou lorsqu'elle appelle de I'assembleur qui utilise les conventions d'appel de Pascal. 

De plus, C est un langage qui fait la distinction entre minuscules et majuscules, ce qui n'est pas le cas des 
autres langages. Cette option permet de supprimer cette distinction pour les fonctions correspondantes. 

Fonctions locales et globales 



Vous aurez sans doute remarque que j'ai utilise le mot cle "extern" dans I'exemple precedent. En fait, cela 
n'est pas vraiment necessaire, car il est present implicitement dans toute declaration de fonction. Dans le 
cas precis de I'exemple, il peut etre utile de stipuler que cette fonction est localisee ailleurs, en plus du fait 
qu'elle utilise une semantique differente. 

Vous vous souvenez aussi que j'ai ecrit plus haut qu'une fonction ne pouvait pas etre imbriquee dans la 
definition d'une autre. Si vous connaissez le Pascal, vous savez qu'on utilise cette technique pour masquer 
une sous-routine aux niveaux supeVieurs. Vous devez alors vous demander comment faire en C quelque chose 
de semblable, si jamais c'est possible ? Ca Test ... 

C est un langage modulaire. Le module pour C est le fichier source. Par consequent, on va rassembler 
I'ensemble des fonctions utilisees de concert, dans un meme fichier source. Certaines de ces fonctions 
peuvent etre publiques (c'est a dire disponibles a I'exterieur du module), tandis que d'autres sont privees 
(r6serv6es a I'usage exclusif des fonctions du module). Done, ce qu'il nous faut, c'est un moyen de cacher les 
fonctions qui ne doivent pas etre directement accedees depuis I'utilisateur de ce module. 

Une fonction priv^e est pr§fixee par le mot cle "static", par exemple : 

static type-r§sultat nom-fonction ( type-paraml ); 

Cette fonction est normalement appelable par toutes les autres fonctions du fichier source, et dans le cas 
d'ORCA/C par toutes les fonctions des fichiers sources inclus au moyen de la directive "append". En 
revanche, cette fonction ne sera marquee comme globale et sera done inconnue pour le linker. Toute tentative 
d'appel depuis une fonction d'un autre module ne pourra etre resolue, provoquant une erreur au moment du 
link. 



Nombre de parametres variable 



C permet de fagon standardisee, done portable, de definir des fonctions ayant un nombre variable de 
parametres. Par exemple, la fonction "printf" peut etre ecrite tres facilement en C. 

Cette m&hode requiert I'utilisation d'un prototype. On indique que la fonction admet un nombre variable 
de parametres en ecrivant "..." a la place du type et du nom du parametre. 
En void un exemple : 

type-resultat nom-fonction ( type-paraml paraml, ... ) 
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Vous remarquerez que j'ai precise un premier parametre fixe. En fait, il s'agit d'une restriction de cette 
possibility : une telle fonction doit en effet avoir au moins un parametre fixe. De plus, les parametres 
variables doivent etre obligatoirement a la fin de la liste des parametres. En general, le parametre fixe 
indique le nombre de parametres variables qui le suivent, ou, comme dans le cas de "printf", il permet de 
determiner au cours de son traitement, les parametres variables a exploiter. 

L'acces a ces parametres se fait par un ensemble de macros et de fonctions de la librairie standard, 
definies dans le fichier header "stdarg.h". 

va_start permet de debuter la recuperation des parametres variables, va_arg est appele successivement 
pour chacun des parametres, et va_end est utilise pour conclure la session. Je vous renvoie au manuel 
d'ORCA/C pour les explications concernant leur utilisation. 



Macros 



Dans la deuxieme partie de I'initiation au C, je vous avais parle du preprocesseur, et notamment de 
I'instruction "#define", utilise pour definir des constantes. 

Cette instruction est aussi utilisee pour definir ce que I'on appelle des "macros". D'un certain point de 
vue, une macro peut etre vue comme une fonction. La difference principale est que le contenu de la macro 
sera substitue a la reference de la macro, au lieu de provoquer un appel a une fonction. 

Cette possibility permet done d'ameliorer les performances d'un programme tout en conservant un certain 
degre de lisibilite, par exemple lorsqu'une section de code est localisee dans une boucle executee un grand 
nombre de fois. 

Les exemples les plus frequents d'utilisation d'une macro concernent des fonctions relativement simples, 
mais tres souvent employees, telles que abs() ou min() et max(). Pour que vous voyez bien ce que cela peut 
donner, quelques exemples : 

#define abs(x) ( (x) > ? (x) : -(x) ) 

#define min(a.b) ( (a) > (b) ? (b) : (a) ) 



Pourquoi tant de parentheses ? Ce qu'il faut bien voir, e'est qu'une macro procede par substitution de ses 
arguments. Par consequent, comme toute expression peut etre passee en parametre, il est preferable de 
I'encadrer par des parentheses, pour eviter toute erreur devaluation. 

En revanche, ('utilisation d'une macro n'est en general pas completement transparente, et presente, 
comme e'est le cas ci-dessus, des possibility d'effets de bord. Par exemple, les macros precedentes 
interdisent d'utiliser les operateurs decrementation et de decrementation, car les parametres sont evalues 
2 fois. Ainsi, si on effectue un abs(x++), on obtiendra la valeur absolue de x+1, ce qui n'est certainement 
pas ce qui est desire; au cas ou vous ne voyez pas pourquoi, faites la substitution a la main. 

Malgre les restrictions precedentes, le concept de macro est tres puissant. 

Comme tous les concepts sophistiques, il faut I'utiliser a bon escient. Le fait qu'une macro procede par 
substitution de ses arguments, on peut notamment passer en parametre des mots clefs du langage. 
Par exemple, la macro : 

#define new(type) (type *) malloc ( sizeof(type) ); 
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realise un Equivalent de I'instruction new() de Pascal. Si on I'appelle par new(long), un entier long sera 
alloue, et un pointeur sur la memoire qu'il occupe sera retourne. 



Recursivite 



Un peu plus haut, j'ai evoque" le fait qu'une fonction en C pouvait s'appeler elle-meme; on designe ce 
mecanisme sous le nom de "recursivite". C'est un concept qui fait un peu peur lorsqu'on est debutant. Je 
vais tenter dans la suite de cet article de vous expliquer en quoi elle consiste, et dans quels contextes elle 
peut etre utilisee. 

La recursivite est un concept tres important dans la definition et la mise en ceuvre des algorithmes. Cela 
est tres utile pour la resolution de certains problemes, pour lesquels une solution iterative (done basee sur 
des instructions du type for ou while) est beaucoup plus difficile a realiser. 

II s'agit notamment des problemes dans lesquels la solution complete est construite a partir de solutions 
partielles a des problemes plus simples, ainsi que de la theorie des jeux lorsque le programme analyse la 
situation sur plusieurs niveaux de profondeur, ou plus generalement des programmes bases sur des 
structures arborescentes, comme par exemple les compilateurs. 

Cependant, comme tout concept puissant, la recursivite doit etre utilisee avec precaution, car elle peut 
produire des programmes difficiles a mettre au point et moins performants qu'une implementation iterative 
(I'appel a une fonction coute souvent plus cher qu'une simple boucle, bien qu& pas trop encore sur le GS); il 
existe d'ailleurs des techniques permettant de supprimer la recursivite, utilisant principalement le type 
pile decrit dans dans le precedent GS Infos. 

Lorsqu'une fonction s'appelle elle-meme (on dit qu'elle s'auto-reference), la recursivite mise en ceuvre 
est dite directe. II existe aussi des cas ou une fonction X fait reference a une fonction Y qui a son tour 
reference a la fonction X : on parle alors de recursivite indirecte. Notez que le nombre d'indirections, c'est a 
dire de fonctions intermediaires, peut etre quelconque. 



Une des difficultes des techniques recursives est de definir la condition d'arret de la recursivite, c'est a 
dire qu'une fonction recursive devra toujours determiner un cas eiementaire pour lequel elle a une r£ponse 
immediate, sans devoir se rappeler elle-meme pour traiter ce cas; ceci permet alors de retourner de 
I'ensemble des appels intermediaires provoques par la recursivite. Une recursivite infinie (done sans 
condition d'arret) se soldera toujours par un debordement de pile et un plantage assure; c'est pourquoi il 
s'agit vraiment d'un concept difficile a maitriser qu'il faut de plus utiliser quand c'est n6cessaire, pour 
eviter de consommer inutilement la ressource limitee qu'est la pile de I'ordinateur. 

La structure de donnees pile decrite dans le precedent numero de GS Infos accompagne souvent les 
algorithmes dont on a supprime la recursivite de maniere a imiter assez fidelement le comportement de 
I'ordinateur lors d'un appel recursif : un nouvel appel d'une fonction recursive provoque en effet un 
nouveau passage de parametres et la creation d'un nouvel espace pour les variables locales qui sont en 
general allouees sur la pile. La notion de recursivite implique done de pouvoir gerer des variables locales 
ind6pendantes d'un appel a I'autre de la fonction. Tous les langages ne sont done pas recursifs, notamment les 
anciens comme Fortran ou Cobol; heureusement C et Pascal le sont, ainsi que I'assembleur si comme pour le 
reste on fait tout soi-meme. 

Prenons un exemple concret; la fonction mathematique factorielle se definit de la facon suivante : 
n! = 1 si n = 

n! = n * (n - 1)1 si n > 
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On a bien ici une fonction recursive puisque n! est defini en fonction de (n-1)! Par exemple, en 
appliquant cette formule, 3! se calcule ainsi : 

3! = 3*(2!) = 3*(2*(1!)) = 3*(2*(1*(0!))) = 3*(2*(1*(1))) = 6 

On voit bien que cette definition n'est pas circulate, n'entrainant done pas une recursivite infinie : 
lorsque la fonction s'auto-reference, la valeur de son argument diminue de 1 a chaque fois; on a de plus une 
condition d'arret sans auto-reference (0! = 1) permettant de stopper la serie d'appels. 

Cette fonction peut se programmer directement telle quelle, par exemple : 

short factorielle ( short n ) 

{ 

if ( n == ) 
return ( 1 ); 
else 

return ( n * factorielle ( n - 1 ) ); 
} 

La fonction factorielle ci-dessus emploie ce que Ton appelle une recursivite finale (en anglais tail 
recursion). C'est a dire que la derniere instruction de la fonction contient la seule auto-reference a la 
fonction. Ce type de recursivite peut toujours etre supprime et doit I'etre dans la plupart des cas, car elle 
possede une equivalence iterative directe. Pour le cas de la factorielle, la fonction iterative est : 

short factorielle ( short n ) 

{ 

short i, fact; 

fact = 1 ; 
if ( n == ) 
return ( 1 ); 
else 

for ( i = 2; i <= n; i++ ) 
fact = fact * i; 
return (fact ); 



w 



} 






Les algorithmes recursifs sont souvent utilises lorsque la solution d'un probleme est etablie en 
decomposant le probleme en des problemes plus simples par raffinements successifs, jusqu'a obtenir un cas 
suffisamment simple pour avoir une solution immediate. La recursivite finale correspond ainsi a la 
resolution du cas n a partir du cas n-1. 

Plus generalement, une fonction recursive est amenee a recombiner les solutions de plusieurs 
sous-problemes (effectuant ainsi plusieurs appels recursifs) avant de generer la solution finale. Cette 
technique est designee sous I'expression diviser pour regner (en anglais divide and conquer) ou parfois sous 
la forme moins militaire mais plus adaptee a I'informatique de diviser pour r§soudre. 

Prenons pour exemple le probleme classique des tours de Hanoi : il s'agit d'un jeu consistant en 3 
aiguilles et un ensemble de disques de tailles decroissantes (en partant du haut) que Ton a empile sur la 
premiere aiguille; le but du jeu est de deplacer ces disques sur la troisieme aiguille avec la double 
contrainte de ne deplacer qu'un seul disque a la fois et de ne placer un disque que sur un disque de plus 
grande taille; un disque peut cependant etre deplace de n'importe quelle aiguille vers n'importe quelle autre. 

Chapitre 5 page 1 2 









Initiation C - Chapitre 5 

Si Ton n'a qu'un seul disque, la solution est immediate : on d§place ce disque de I'aiguille A vers I'aiguille 
C. Si Ton a 2 disques, c'est a peine plus compliqu§ : on deplace le premier disque de A vers B, puis le 
deuxieme de A vers C, et enfin le premier disque a nouveau de B vers C. 

A partir de 3 disques, cela commence a se compliquer serieusement. Pour trouver une solution generate au 
probleme, il faut essayer de trouver un motif dans les solutions a 1 et 2 disques. 

On s'apergoit alors du principe suivant : pour pouvoir deplacer le plus grand disque de A vers C, il faut 
d'abord deplacer les disques plus petits qui sont au dessus sur I'aiguille B. Une fois que cela a 6te effectue, il 
faut deplacer la pile qui est maintenant sur B vers C. En reexprimant ce mecanisme de facon recursive, cela 
donne : 

si nombre de disques > alors 

d§placer le nombre - 1 de disques plus petits de A vers B 

deplacer le plus grand disque de A vers C 

deplacer le nombre - 1 de disques plus petits de B vers C 

Par exemple, pour 3 disques, Palgorithme permet de deplacer les 2 petits disques de A vers B, puis le 
grand disque de A vers C, puis les 2 petits disques de B vers C. En d§composant encore la premiere et la 
derniere etapes de facon recursive, on s'apercoit que pour deplacer les 2 petits disques de A vers B, il faut 
d'abord deplacer le plus petit des disques sur C, puis I'autre sur B, et enfin le petit disque que Ton a mis 
provisoirement sur C, sur B. 

^implementation de cet algorithme est extremement courte, par exemple en C : 

void hanoi ( short n, char a, char b, char c ) 

{ 

if ( n > ) { 

hanoi ( n-1, a, c, b ); 

printf ( "Deplacement du disque %c vers %c\n", a, c ); 

hanoi ( n-1, b, a, c ); 

} 
} 

Cette fonction peut alors s'appeler ainsi : hanoi ( 3, 'a', 'b', 'c' ); 

Vous trouverez une implementation complete de cette fonction dans le programme Hanoi1.cc. 

La suppression de la recursivite" de cette fonction, bien que possible (en utilisant la structure de donnees 
pile), rend la fonction beaucoup plus incomprehensible (sans parler du fait que le code est nettement plus 
consequent), alors que la forme ci-dessus est particulierement elegante, comme vous pourrez le constater 
dans le programme Hanoi2.cc. 

C'est typiquement le cas ou la recursivite montre toute sa puissance et sa simplicity d'ecriture, a defaut 
de pouvoir suivre facilement le dGroulement des operations. 

Pour le fun, j'ai aussi ecrit une version graphique que vous trouverez dans Hanoi3.cc. Cette version 
montre visuellement le defacement des disques. 
L'animation est simplified a Pextreme, mais pour un cas aussi simple que celui-ci, elle suffit largement. 

Ces 3 programmes (ainsi que mes autres productions) constituent un bon ensemble d'exemples de 
fonctions. 
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Utilisation de la memoire par un programme C 



-^ 



Sur le GS, qui est une machine 16 bits, I'ensemble des fonctions du programme, auxquelles s'ajoutent 
celles de la librairie C, appeiees soit explicitement, soit implicitement, doivent occuper normalement au 
maximum 64 Ko de memoire. Dans la plupart des cas, c'est largement suffisant. Toutefois, si vous veniez a 
ecrire un programme enorme, necessitant plus de 64 Ko de code, ORCA/C dispose de I'instruction "segment" 
qui permet de regrouper toutes les definitions de fonctions suivant son utilisation dans un autre segment, 
permettant ainsi de s'affranchir de la limite des 64 Ko. 

On peut utiliser autant de fois que necessaire cette instruction, creant autant de segments. On peut meme 
regrouper des fonctions qui ne suivent pas dans le source, ou qui sont localisees dans un autre fichier 
source, dans un meme segment, des lors qu'on utilise le meme nom de segment. Un segment peut aussi etre 
dynamique, c'est a dire n'etre charge en memoire que lorsqu'on appelle I'une des fonctions qu'il contient. 
Pour cela, on precise I'option "dynamic" lorsqu'on ecrit I'instruction "segment". Avec ORCA/Pascal, les 2 
directives "segment" et "dynamic" permettent de realiser la meme chose. 

Dans la situation standard, les donnees globales sont stockees dans le meme segment que le code, ce qui peut 
etre aussi la cause de la saturation des 64 Ko. ORCA/C et ORCA/Pascal disposent de la directive 
"memorymodel" permettant de generer un segment de donnees specifiques, independant de celui dans lequel 
est stocke le code. En fait, lorsqu'on utilise le modele "large memory", ORCA/C et ORCA/Pascal generent 2 
segments de donnees, I'un de 64 Ko pour les variables globales scalaires, et un de taille non limitee pour les 
tableaux. 

Cette directive presente I'inconvenient de ralentir I'acces aux tableaux et de necessiter I'emploi d'une 
autre librairie (ORCAGLIB) au lieu de la librairie standard ORCALIB. En revanche, la librairie Pascal 
PASLIB fonctionne avec les 2 modeles. 

Je pense que Ton n'a jamais besoin d'utiliser cette directive, car il n'est pas raisonnable de declarer des 
tableaux statiques de grande taille. En effet, une telle declaration est souvent faite en provision de la 
manipulation d'un grand volume de donnees. Or, dans la plupart des cas, on n'aura qu'a gerer une faible 
quantite de donnees, ce qui a pour consequence de gacher une partie de la memoire, et d'eventuellement 
interdire I'acces simultane" a d'autres programmes (accessoires ...). 

II est preferable d'allouer dynamiquement la memoire necessaire au cas qui se presente, ce qui ne 
necessite pas d'utiliser la directive "memorymodel" (meme si on alloue plus de 64 Ko, contrairement 
d'ailleurs a ce qui est indique dans le manuel), et permet de s'adapter a toutes les situations. Ainsi, si la 
memoire disponible ne permet pas de traiter un volume de donnees trop important, le programme reste 
utilisable avec une quantite plus faible. 

En fait, la taille du code et des donnees pose rarement un probleme (a moins que vous ne reecriviez 
AppleWorks GS :-). La veritable limitation de memoire se situe au niveau de la pile. En effet, celle-ci doit 
obligatoirement se situer dans les 64 premiers Ko de la memoire (que Ton appelle le banc 0). 

Or, pour assurer la compatible avec les Apple II 8 bits, toute cette memoire n'est pas disponible; de 
plus, GS/OS et le loader en occupent une bonne partie. Si bien qu'il n'y a environ que 40 Ko qui sont 
utilisables. 

Lorsqu'on lance un programme (par exemple, par I'intermediaire du Finder™ ou du shell ORCA), GS/OS 
alloue automatiquement une pile de 4 Ko (sauf si on specifie explicitement une autre taille). Le probleme est 
que les programmes crees par ORCA/C et ORCA/Pascal n'utilisent pas cette pile; a la place, le code de 
demarrage situe dans le ".root" alloue une nouvelle pile de 8 Ko par defaut. C'est a dire que chaque 
programme C ou Pascal consomme 12 Ko de memoire dans le banc 0. II peut done §tre impossible de pouvoir 
lancer un programme avec d'autres programmes deja charges, par exemple sous MultiSwitch, alors qu'il y 
a encore plein de memoire disponible, uniquement parce que le systeme ne peut pas allouer la place 
demandee pour la pile. 
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La perte des 4 Ko de la pile allouee automatiquement par GS/OS peut etre facilement annulee en linkant 
avec un segment de type "stack/direct page" qui doit etre ecrit en assembleur; en voici un exemple : 

StackDP START -StackDP ; on donne un nom au load segment 

KIND $12 ; cr§e un segment de type stack/direct-page 

DS 256 ; taille minimale de la pile = 1 page 
END 

Pour vous eviter de la frappe, vous trouverez le source et I'objet de ce segment sur votre disquette GS 
Infos. Notez qu'on ne peut pas creer un segment de ce type de moins d'une page. Enfin, c'est toujours mieux 
que ce que font les compilateurs ORCA... 

Contrairement a ce qui est 6crit dans les manuels des compilateurs ORCA, il n'est que rarement nScessaire 
de disposer de 8 Ko de pile : ce besoin s'applique essentiellement aux programmes recursifs (et encore, cela 
depend de la profondeur attendue de la recursivite), Sventuellement aux programmes en mode bureau (la 
botte a outils requiert pas mal d'espace sur la pile), et aux programmes declarant des tableaux en variables 
locales, done sur la pile. Dans ce dernier cas, on peut eviter d'utiliser la pile pour les grosses variables 
locales en precedant la declaration du mot cle "static", si bien que ces variables se retrouvent allou§es dans 
le meme espace que les variables globales; elles restent n6anmoins locales, sauf que leur valeur est 
preservee d'un appel a I'autre, mais on n'est pas oblige d'en tenir compte. Le seul cas ou cela peut poser un 
probleme, c'est lorsque la fonction est recursive, mais je ne connais pas d'exemple de telle fonction 
necessitant de manipuler de gros volumes de donnees. Notez qu'en Pascal, on ne dispose pas de cette 
possibility d'avoir des variables locales n'utilisant pas la pile. 

Une fois que Ton a fait en sorte de ne pas consommer excessivement la pile, il suffit d'indiquer au 
compilateur de moderer sa boulimie avec la directive "stacksize". II est raisonnable de dSfinir une pile de 4 
Ko pour un programme moyen et de descendre a 2 Ko pour un petit programme, ou un utilitaire pour le 
shell. 

J'avoue n'avoir pas utilise cette directive dans aucun des programmes que je vous ai fournis : la raison en 
est qu'il s'agit soit d'exemples qui ne sont pas destines a etre utilises de facon intensive, sort que le 
programme n'en a pas besoin; par exemple le NDA calculatrice (comme tous les NDA) utilise la pile de 
I'application note. D'ailleurs dans le cas des accessoires, il faut consommer la pile avec le plus de 
moderation possible, car on ne sait pas reellement combien de place est disponible dans I'application qui 
nous heberge; si Ton est un gros consommateur, il faut envisager de s'allouer sa propre pile au moment de 
I'ouverture. 

Declaration des prototypes 






Lorsqu'on utilise le m§canisme de prototype, il est d'usage de declarer toutes les fonctions constituant le 
programme dans un fichier "header" (de suffixe ".h"), qu'elles soient appelees avant ou apres leur 
definition. Ainsi, on est sur que le compilateur pourra detecter toutes les erreurs Sventuelles. C'est ce qui 
est fait pour les fonctions de la librairie C, dans chacun des fichiers header correspondant a la famille 
d'appartenance de ces fonctions. 

Je vous rappelle que la directive "lint" permettra de verifier que toutes les fonctions definies dans un 
programme ont bien §te" declarees. Ainsi, en les declarant dans un fichier "header", on s'assurera d'un 
maximum de coherence du programme. Ce sont en effet les erreurs de declaration/definition/appel de 
fonction qui sont a la source de pratiquement tous les plantages des programmes C, puisqu'elles provoquent 
en general une corruption de la pile qui, sur le GS, est fatale. 
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Parametres 



•w 



J'avais volontairement omis de definir toute la terminologie se rapportant aux parametres. Cependant, je 
me suis dit apres coup que vous aurez forcement a faire a ces termes dans la literature. Alors, void un 
petit glossaire : 

• On emploie le terme "parametre former ou "argument" pour designer le type et la position d'un 
parametre lors de la definition d'une fonction. Ceci signifie simplement que cet argument sera substitue par 
le contenu des variables correspondantes de la fonction appelante lors de I'appel. 

• Les variables passSes a une fonction lors de I'appel a cette fonction sont designees sous le nom de 
"parametres actuels" ou plus simplement de "parametres". En fait, il n'y a pas grand chose d'autre a dire 
de plus, par rapport a ce que nous avons vu dans le precedent article ... 

Dans la litterature, les 2 termes "parametre" et "argument" sont parfois utilises de fagon 
interchangeable ou a I'inverse de la definition precedente. 
J'espere que vous voyez bien la difference entre les 2, et que cela ne vous pertubera pas outre mesure. 

Comme en C, les arguments sont passes aux fonctions de droite a gauche, il peut s'ensuivre des effets de 
bords involontaires. Supposez par exemple que vous appeliez une fonction "f(j,k) B ainsi "f(i,i++)"; si 
"i" valait "1" avant I'appel, les valeurs des parametres "j" et "k" dans la fonction "f" seront 
respectivement "2" et "1", ce qui n'est certainement pas ce que vous esperiez ! 

Bien entendu, cet exemple est simplifie a I'extreme, mais ce type de surprise peut vraiment se produire 
dans des situations reelles. 



w 



Allez, histoire de s'amuser un peu, je vais donner du pain aux detracteurs de C ;-) Vous vous souvenez 
peut-etre que C dispose d'un operateur "," dit de "sequence"; je vous avais dit a I'epoque qu'on I'utilisait 
essentiellement avec I'instruction "for". Or, la "," est aussi employee pour separer les parametres d'une 
fonction. C fait la distinction entre les 2 cas en fonction du contexte. Toutefois, chaque argument d'une 
fonction pouvant etre en fait une expression, on pourrait envisager d'utiliser I'operateur "," dans ladite 
expression. Comment le compilateur fait-il la difference ? Eh bien, il suffit de mettre I'expression en 
question entre "()". Voyons sur un exemple, histoire d'eclaircir un peu ce charabia : 
"f(z,(z=y+x,w=z-t))". Hum ... est-ce que c'est vraiment plus clair ? En fait I'exemple est simple : les 2 
parametres sont "y+x" et "y+x-t", sauf que Ton a sauv6 dans les variables "z" et "w" les r§sultats 
intermediates; rappelez-vous que les parametres sont evalu6s de droite a gauche, d'ou la valeur du 
premier. Je vous ai montre cet exemple juste pour le fun; dans la pratique, on n'a jamais besoin de faire des 
choses pareilles ... 



L'ordre devaluation que je vous ai indique est le plus souvent I'ordre utilise, mais la definition du langage 
C ne le garantit pas, c'est a dire que la supposition de la valeur de "z" dans I'exemple precedent peut 
s'averer fausse avec d'autres machines ou d'autres compilateurs; alors, evitez tout effet de bord I En tout 
cas, vous pouvez imaginer combien l'6criture d'un compilateur C est autrement plus compliquee que celle 
d'un compilateur Pascal. 

Parametres variables 






La possibility d'avoir des parametres variables, ainsi que I'obligation d'avoir au moins un parametre fixe 
au debut de la liste des arguments sont li§s au fait que les parametres sont traites de droite a gauche. La 
plupart des machines et des compilateurs utilisent la pile pour le passage des parametres. Sur presque tous 
les ordinateurs, les adresses dans la pile sont decroissantes. Done le parametre le plus a gauche de la liste se 
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retrouve empile le dernier et est done le plus proche du pointeur de pile (si Ton fait abstraction de 
I'adresse de retour). On peut done facilement obtenir son adresse et de la, acceder a tous les autres 
parametres avec les macros "va_start" et "va_arg". 

La derniere fois, je vous avais renvoye a la doc pour de plus amples details. 
Je vais quand meme vous donner un exemple autre de celui qu'elle donne : 

short max ( short n, ... ) /* calcul du max de n valeurs */ 

{ 

vajist argp; /* declaration ptr liste parametres variables */ 

short i, m; 

va_start ( argp, n ); /* initialisation du ptr sur parametres variables 7 

m = va_arg ( argp, short ); /* 1ere valeur donne le max provisoire 7 
while ( -n > ) { 

i = va_arg ( argp, short ); /* valeurs suivantes : doivent etre des short 7 
if ( i > m ) 
m = i; 

s_ ) 

va_end ( argp ); /* nettoyage de la pile 7 

return ( m ); 
} 

Le seul inconvenient de ce mecanisme est qu'il interdit tout controle de type et de quantite des parametres 
par le compilateur. Par exemple dans I'exemple ci-dessus, rien n'interdit d'appeler "max" avec des 
entiers longs ou des reels. II faut done utiliser cette possibility avec prudence. D'un autre cote, e'est grace a 
ce mecanisme que C dispose d'une fonction telle que "printf qui n'a pas besoin d'utiliser d'astuces 
particulieres, et peut done etre reecrite facilement, par exemple pour appeler QuickDraw. En Pascal, il 
est totalement impossible d'ecrire une fonction similaire a "write". 



Appel d'une fonction 



En C, I'appel d'une fonction est effectue en indiquant le nom de la fonction suivi de la liste des arguments 
entre parentheses. Comme en Pascal, il n'y a pas de mot cle pr£cisant que Ton effectue un appel de fonction. 
Dans les anciens langages, tels Fortran ou Cobol, I'appel a une sous-routine se fait en utilisant I'instruction 
"CALL". 

II est tres important de noter que C se sert des parentheses pour distinguer I'appel d'une fonction de la 
reference a une variable quelconque, notamment a cause de I'historique du langage. Je vous rappelle en effet 
qu'on n'etait pas oblige de declarer une fonction avant de I'appeler; e'etait le seul moyen pour le 
compilateur de faire la distinction. 

Par consequent, les parentheses sont obligatoires, meme lorsque la fonction n'a pas de parametres. 
L'appel a une telle fonction sera alors de la forme "nom-fonctionQ". 
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Retour d'une fonction 



L'instruction "return", que nous avons vue dans le precedent numero, permet de retourner a la fonction 
appelante une valeur correspondant a revaluation de I'expression associee a l'instruction. La syntaxe est 
alors "return (expression)". Le rSsultat de revaluation de cette expression doit bien entendu avoir le 
meme type que celui avec lequel la fonction a 6te declaree. 

Si I'expression est omise, la valeur retournee sera quelconque et ne donnera pas le r§sultat escompte; en 
g§n6ral ce sera la valeur presente dans le registre "A" au moment du "return". 

Si la fonction a 6te d6claree "void", c'est a dire qu'elle ne retourne rien et se comporte done comme une 
procedure Pascal, l'instruction "return" est alors utilisee telle quelle, sans pr§ciser d'expression, sinon 
une erreur sera signalee. 

La fonction effectuera un "return" implicite lorsque son execution atteindra I'"}" fermant le bloc 
principal de la fonction. Ce cas ne s'applique que lorsque la fonction ne retourne aucune valeur. Le 
comportement 6tant identique a celui du "return" simple, si la fonction doit retourner une valeur, celle ci 
sera quelconque (en fait ce sera la valeur du registre "A" a ce moment), et provoquera sans doute une 
erreur de fonctionnement du programme. 



La fonction "main" 



Dans mon precedent article, je vous ai indique que la fonction "main" etait la premiere executee d'un 
programme C. Etant une fonction comme une autre, elle accepte des parametres, sauf qu'ils sont predefinis 
par le langage. On les designe habituellement sous les noms "argc" et "argv"; le deuxieme est un tableau de 
chaines de caracteres, chacune de ces chaines correspond aux mots listed apres le nom du programme (que 
Ton retrouve d'ailleurs comme premiere chaine du tableau); le premier parametre est le nombre 
d'etements du tableau. Ces parametres n'ont un sens que lorsque le programme est lance depuis le shell et 
est de type EXE ($B5). Lorsqu'un programme est lance" depuis le Finder™ ou Prosel-16 ou depuis le shell si 
il est de type S16 ($B3), argc et argv sont inutilisables; argc vaudra et argv NULL. 

Si vous vous rappelez de mon premier article, je vous avais presente un programme qui imitait la 
commande "echo" du shell. En void une nouvelle version b§neficiant de ce que nous avons appris depuis : 

#include <stdio.h> 

void main ( short argc, char *argv[] ) 

{ 

short i; 

for ( i = 1 ; i < argc; i++ ) 

printf ( "%s ", argv[i] ); 
printf ( "\n" ); 

} 

Si je compile et linke ce programme sous le nom "msg", et que je tape la commande "msg Bonjour !", il 
me repondra par "Bonjour I". Si "i" avait d6marre a 0, j'aurais aussi eu le nom du programme affiche, 
eventuellement avec le chemin si je I'avais precise. 

Un argument d'un programme peut comprendre plusieurs mots, si ceux-ci ont §te entour6s par des """. 
Toutefois, I'argument "argv[n]" correspondant ne contiendra pas les """. 
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Tout ceci est realist par le code du fichier ".root" gener6 par le compilateur ORCA/C. Ce code initialise 
I'environnement, c'est a dire qu'il alloue la pile comme indique au debut de cet article, decode la ligne de 
commande dans les parametres argc et argv, ouvre les fichiers standard de C, "stdin", "stdout" et 
"stderr", en tenant compte des redirections eventuelles, et appelle la fonction "main". 

Lorsque la fonction "main" retourne a son appelant soit explicitement avec I'instruction "return", soit 
implicitement en atteignant I'} finale, le code du fichier ".root" reprend la main pour faire le menage : 
fermer les fichiers, liberer la memoire, et quitter vers le shell ou un autre lanceur de programmes. La 
fonction "main" peut retourner une valeur qui sera transmise au shell dans la variable d'environnement 
"{Status}" : par convention, on retourne si tout c'est bien passe\ et une autre valeur en cas d'erreur, la 
valeur "-1" §tant utilisee pour indiquer une erreur generique. 

Un programme peut se debrancher directement au code contenu dans le fichier ".root" suivant I'execution 
de la fonction "main". II dispose pour cela des fonctions de la librairie C "exit", "_exit" et "abort". La 
premiere effectue le meme travail que lorsqu'un return est effectue depuis la fonction main. Le second rend 
la main au shell sans faire aucun menage (toutefois, le shell ferme aussi les fichiers et libere la memoire). 
Dans les 2 cas, on peut passer une valeur qui sera affectee a la variable shell "{Status}". Dans le cas 
d'ORCA/C, la troisieme fonction est identique a _exit(-1). 

Pour pouvoir beneficier pleinement de ces fonctions d'arret, un programme peut aussi enregistrer une ou 
plusieurs fonctions qui seront executees avant de rendre la main au code du fichier ".root", grace a la 
fonction de la librairie C "atexitO". On designe de telles fonctions sous le vocable de "exit handler". Elles 
permettent de faire du manage en plus de celui fait normalement par la librairie C via le fichier ".root", et 
done de terminer le plus proprement possible. 
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Chapitre 6 



Les Structures 

Dans la deuxieme partie de cette initiation (dans le numero 16 de GS Infos, il y a deja plus d'un an !), nous 
avons etudie les types de base, ainsi que la declaration de variables de ces types. Les types de base 
correspondent en general (et cela est particulierement vrai pour le C) aux objets manipulates directement 
par le micro-processeur. lis permettent de representer la plupart des donnees elementaires requises par 
les problemes les plus simples. 

Toutefois, meme des problemes relativement simples necessitent de manipuler des donn6es plus complexes 
que ce que peuvent offrir les types de base d'un langage. II est notamment souvent necessaire de gerer des 
quantites de donnees qui ne peuvent etre representees par les types de base. 

C, comme la plupart des autres langages, dispose de 2 constructions permettant d'etablir de nouveaux 
types de donnees que Ton dit "composites" ou "composees" : les "tableaux" et les "structures", ces 
dernieres correspondant aux "record" de Pascal. 

Les tableaux permettent de regrouper sous un meme nom de variable un ensemble de donnees de meme 
type, tandis qu'une structure sera utilisee pour representer une donnee comprenant des elements qui 
peuvent etre de differents types, en permettant de les manipuler comme une seule entite. 

Contrairement a ce que j'ai pu annoncer dans les numeros precedents, nous n'etudierons les tableaux que 
dans le prochain article. II est en effet difficile de les traiter de fagon detaillee sans aborder les pointeurs, 
ce que nous ferons la prochaine fois. 

Done, dans cet article, nous allons presenter la definition d'une structure en C, ainsi qu'une partie des 
operateurs specifiques aux structures (les autres font appel aux pointeurs et seront done traites a ce 
moment). 

Definition d'une structure 






Comme il a ete dit precedemment, une structure permet de regrouper sous un meme nom, un ensemble de 
donnees de types divers, qui peuvent etre de base ou composites (e'est a dire que cela peut etre d'autres 
structures ou des tableaux). 

Voyons tout de suite un exemple pour clarifier les choses : 

struct personne { 
string nom; 
string prenom; 
short age; 
string numero_ss; 

}; 

Cet exemple definit une structure (le mot clef "struct" indique au compilateur qu'on va effectuer une 
telle definition) intitulee "personne" et comprenant un certain nombre de rubriques : le nom, le prenom, 
l'age et le numero de securite sociale de cette personne. Notez que j'ai utilise un type "string" qui n'existe 
pas en C; pour cet article, nous supposerons qu'il a ete defini quelque part comme etant par exemple un 
tableau de caracteres; en fait cela n'a pas d'importance. 
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La definition d'une structure consiste done a lister les declarations des donnees constituant cette 
structure. Ces donnees sont appelees des "champs" ("fields" en anglais) ou encore des "membres". Chaque 
champ est une variable qui est done nommee (il existe une exception que nous verrons plus loin) et typee; 
on peut utiliser tous les types disponibles en C, ainsi que des types definis prec6demment dans le 
programme, a I'exception du type "void". On ne peut pas non plus definir ni declarer une fonction a 
I'interieur d'une structure (mais on peut le faire en C++, e'est d'ailleurs le principe de base d'un langage 
oriente objet); en revanche, on peut declarer un pointeur sur une fonction, comme nous aurons I'occasion de 
le voir dans un prochain article. 

Un membre ne peut pas non plus etre du type de la structure (e'est a dire que la structure ne peut pas 
s'auto-ref6rencer, sinon cela creerait une recursivite infinie et rendrait impossible le calcul de sa taille), 
sauf si e'est un pointeur, ce qui permet de creer des structures chamees. Nous y reviendrons dans un 
prochain article. 

Chacun des membres est stocke en memoire dans le meme ordre que celui dans lequel il a ete liste. Avec la 
structure precedente, on trouvera d'abord le nom puis le prenom, I'age et enfin le numero de securite 
sociale. 

Le nom que Ton donne a la structure afin de I'identifier ulterieurement est designe par le terme de "tag" 
(intraduisible en frangais, j'ai cependant utilise dans la suite de cet article le terme "identifiant"); on s'en 
sert dans la suite du programme pour declarer des variables du type de cette structure. Par exemple : 

struct personne moi, lui; 

Cependant, ce "tag" est optionnel; on peut tout a fait definir la structure et declarer des variables du type 
ainsi defini en meme temps, comme par exemple : 

struct { 

short jour; 

string mois; 

short an; 
} date, hier; 

Cette structure declare 2 variables "date" et "hier" composees d'un "jour" et d'un "an" numeriques et 
d'un "mois" alphabetique. Cette syntaxe est equivalente a celle que Ton utilise pour declarer une variable 
simple, et va done demander au compilateur d'allouer la memoire necessaire au stockage des variables 
declares. 

En revanche, la definition d'une structure avec simplement son identifiant (son "tag") correspond a la 
description d'un modele, et ne provoque done pas d'allocation de memoire pour le representer (il n'est 
defini qu'au niveau du compilateur). Ce n'est qu'en declarant des variables du type de cette structure qu'on 
allouera la memoire necessaire a leur stockage. 

On peut aussi bien entendu donner un nom a la structure et declarer des variables en meme temps, auquel 
cas on allouera la memoire necessaire aux variables, et on se donnera la possibility de declarer de nouvelles 
variables du type de cette structure. II est tout aussi evident qu'il faut soit donner un identifiant a la 
structure, soit declarer des variables. 

La syntaxe de I'exemple presente toutefois un inconvenient : puisque la structure n'est pas nommee, on ne 
pourra pas declarer de nouvelles variables de ce type, sans redefinir le contenu de la structure, ce qui n'est 
pas une tres bonne idee pour la clarte et la maintenabilite du programme. De plus, certains compilateurs 
peuvent refuser une telle redefinition. 
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Pour pallier a cet inconvenient et eviter de repreciser le mot clef "struct" a chaque fois que I'on veut 
declarer une variable, on utilise tres souvent le mot clef "typedef" (permettant de definir un nouveau type) 
avec les structures. Notre premier exemple pourrait alors etre : 

typedef struct { 

string nom; 

string prenom; 

short age; 
string numero_ss; 
} personne; 

Notez que le nom du type est donne a la position de la variable et non pas a celle du nom de la structure. 
Cela vient du fait que "typedef" est consider^ par le compilateur comme une "classe de stockage"; il se 
refere done a une variable qui est alors consideree comme un nom de type. La raison de cette classification 
est que "typedef" ne definit pas reellement de type, mais permet d'associer un synonyme (ou une 
abr§viation a une definition complexe) a un type d6fini par ailleurs. Dans notre exemple, le type est dSfini 
par "struct", "typedef" servant uniquement a donner le synonyme "personne" au type "struct" (qui n'est 
pas nomme dans Pexemple). En quelque sorte, "typedef" est equivalent au "#define", excepte qu'il est 
traite par le compilateur et non par le pr^processeur. 

Une fois la structure d^finie, on declare une variable de ce type ainsi : 

personne moi, lui; 

II n'est alors plus necessaire d'indiquer qu'il s'agit d'une structure, "typedef" ayant associe le nouveau 
type "personne" a la definition de la structure. 

On peut bien entendu imbriquer les structures; par exemple, pour notre personne, on pourrait avoir : 

typedef struct { 
string nom; 
string prenom; 
date naissance; 
} personne; 

en ayant pr§alablement defini le type date, par exemple : 

typedef struct { 

short jour; 

string mois; 
short an; 
} date; 

Si la structure referenced ne sert qu'a la structure y faisant appel, on peut la definir a I'interieur de la 
premiere, ce qui donne en reprenant Pexemple precedent : 

typedef struct { 
string nom; 
string prenom; 
struct { 

short jour; 
string mois; 
short an; 
} naissance; 
} personne; 
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Dans ce cas, la structure date n'existe que dans le contexte de la structure personne, et ses champs ne 
peuvent pas etre accedes en dehors de ce contexte. 

La declaration des membres d'une structure correspondant a la declaration d'une variable ordinaire, elle 
respecte la meme syntaxe, excepte qu'on ne peut specifier aucun attribut, que Ton designe en C par "classe 
de stockage"; en revanche, ces attributs sont utilisables avec une variable de type struct. Par exemple, on 
peut declarer plusieurs membres pour un meme type, en les separant par des ",", ou indiquer qu'une 
variable de type structure est "static", ce qui rend tous ces membres "static"; en revanche, cela n'a aucun 
sens (et c'est done interdit) de declarer que I'un des membres est "static". 

Differentes structures peuvent avoir des membres ayant le meme nom, puisque ceux-ci ne seront 
accessibles qu'en les qualifiant par le nom de la structure. De meme, les noms de ces membres pourront etre 
identiques a des noms de variables simples. Enfin, I'identifiant d'une structure (le "tag") peut aussi avoir 
un nom identique a des noms de membres ou de variables simples, car il n'est pas utilise dans le meme 
contexte. Toutefois, il est d'usage de n'utiliser le meme nom pour 2 entites differentes que si elles 
represented des objets similaires. 

Initialisation d'une structure 



Une variable de type struct peut etre initialisee de la meme fagon qu'une variable simple en faisant suivre 
sa declaration du signe "=" et de la liste des valeurs a donner a chacun des membres, separees par des "," et 
entouree par des "{}", par exemple : 

struct { 

string nom; 
string prenom; 
struct { 

short jour; 
string mois; 
short an; 
} naissance; 
} bird = { "Parker", "Charlie", 20, "aout", 1920 }; 

Lorsqu'une structure est incluse dans une autre, il n'est pas obligatoire d'entourer les valeurs de ses 
membres par de nouvelles "{}", a condition de donner une valeur a I'ensemble des membres, ce qui est 
generalement le cas. 

Dans le cas ou on n'initialise que les premiers membres d'une structure, les autres se verront attribuer 
la valeur 0. 

Si la variable de type struct est declaree comme une variable globale ou "static" et qu'elle n'est pas 
initialisee, I'ensemble de ses membres seront egaux a 0; les variables locales "auto" auront une valeur 
quelconque (en fait ce qu'il y a sur la pile au moment de I'appel a la fonction dans laquelle elles sont 
declarees). II n'est bien sur pas possible d'initialiser une structure etant declaree "extern", comme cela 
est d'ailleurs le cas pour toutes les variables, quel que soit leur type. 

Regie d'alignement 

Tous les exemples que je vous presentes jusqu'a present sont corrects. En particulier, I'ordre des 
membres que j'ai utilise correspond a une certaine logique d'organisation des informations, qui, a priori, 
semble appropriee. 
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Toutefois, cet ordre pr§sente un defaut : il ne tient pas compte de la regie d'alignement. En fait, sur le GS, 
cela n'est pas trop genant, mais sur des machines plus sophistiquees, et notamment sur des processeurs 
RISC, il y a de fortes chances que ces definitions soient rejetees par le compilateur. 

Commengons par d6finir ce qu'est cette fameuse regie d'alignement : une donn§e est dite "naturellement 
alignee" (ou plus simplement "aligned") lorsque son adresse est un multiple de sa longueur. 

En d'autres termes, cela signifie qu'un mot de 16 bits est aligne si il a une adresse paire, un mot de 32 
bits Test si son adresse est un multiple de 4 et un caractere (ou une chaine) est aligne" quelle que soit son 
adresse. 

Pour amSliorer les performances d'un ordinateur, on a mis au point de nouveaux processeurs que Ton a 
appele" "RISC" ("Reduced Instruction Set Computer", c'est a dire "Ordinateur a jeu d'instructions 
r6duit"), et qui d'ailleurs n'est plus tenement r6duit de nos jours, mais plutot simplifie. 

Par extension, on a aussi appele" les processeurs les ayant precede, "CISC" ("Complex Instruction Set 
Computer"). 

A part les toutes dernieres generations, ces processeurs sont tous 32 bits (les nouveaux sont 64 bits, 
mais il n'existe pas encore reellement d'ordinateurs les exploitant), c'est a dire que I'unite d'acces a la 
m^moire est un mot long de 32 bits. 

Done, pour obtenir une performance maximale, le processeur ne sait acceder qu'a un mot de 32 bits 
aligne\ c'est a dire qu'il sait acc6der a I'adresse 0, 4, 8 ... a I'exclusion de toute autre adresse; si la donnee 
ne fait que 16 ou 8 bits, le processeur lira le mot long I'incluant, masquera la partie inutile et fera un 
decalage pour replacer la partie utile au bon endroit. 

On peut remarquer que la plupart des processeurs CISC precedent de la meme maniere; c'est notamment le 
cas des 680x0 qui ne savent pas acceder a une adresse impaire. 

Si un entier long se trouve a une adresse non aligned, par exemple a I'adresse 2, une tentative d'acces a ce 
long avec un processeur RISC provoquera une violation d'acces qui sera r^cuperee par le systeme, lequel 
remplacera cet acces par 2 acces, Tun a I'adresse et I'autre a I'adresse 4, puis isolera les 2 mots de 16 
bits qu'il r§int£grera ensuite dans le mot de 32 bits demands. 

Vous pouvez imaginer que cela est une action assez couteuse, suffisamment en tout cas pour annuler le gain 
de performances pouvant etre apporte" par le processeur. II n'est done pas rare de voir des machines RISC 
tourner apparemment plus lentement que des machines CISC, car malheureusement, beaucoup duplications 
ne tiennent pas compte de la regie d'alignement (en fait beaucoup ont 6t6 portees depuis un environnement 
CISC sans etre readaptees). Si le systeme ne possede pas une telle fonction de r6alignement (ce qui est 
rarement le cas, sinon presque aucune application n'aurait tourne sans necessiter sa reecriture), le 
programme sera tout simplement rejete" par le compilateur, puisqu'il ne pourra pas s'executer. Dans le cas 
contraire, le compilateur se contente de signaler le probleme d'alignement. 

Si on le souhaite, on peut demander au compilateur de forcer I'alignement, mais cela peut avoir des 
consequences facheuses, comme nous aliens le voir un peu plus loin. 

Ne croyez pas pour autant que le probleme n'existe que sur les machines RISC; la plupart des machines 
CISC ne savent pas non plus accepter a des donnees non aligners. Seulement, comme le processeur est 
"complexe", il effectue de lui-meme le double acces, ainsi que la reconstitution de la donnee demandee, de 
fagon transparente. Ceci implique cependant que les capacit£s de I'ordinateur sont loin d'etre exploiters a 
leur maximum. 

J'ai d£ja fait I'exp6rience, qu'en alignant les donn§es correctement, on pouvait obtenir un gain de 
performances de pratiquement 100% pour un programme quelconque sur une machine donnee (c'est a dire 
qu'il va 2 fois plus vite !) 
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Je ne sais pas trop comment se comporte le GS; a priori, il me semble que le 65C816 est capable 
d'acceder directement a n'importe quelle adresse, et qu'il lui est done possible de lire directement un mot de 
16 bits situe a une adresse impaire. Mais, il est tout aussi possible qu'il accede a chacun des 2 mots 
contenant I'un des octets du mot d§sire pour les recombiner, de fagon totalement transarente; par exemple, 
si notre mot est a I'adresse 1, il doit lire les mots aux adresses et 2 et isoler puis combiner les octets 
utiles. 

Comment faire pour r6soudre ce probleme ? Pour les variables simples, il est du role du compilateur de 
garantir qu'elles sont alignees a une frontiere multiple de leur longueur. II est a noter que les compilateurs 
sur GS ne respectent pas cette regie, et que les variables simples sont done situees a n'importe quelle 
adresse. II ne reste done qu'a esperer que le 65C816 sache reellement acceder directement a n'importe 
quelle adresse, sinon on peut faire son deuil de la performance optimale d'un programme en langage evolue 
sur GS. C'est aussi vrai d'ailleurs en assembleur, si Ton ne fait pas attention, d'autant plus que I'on est 
oblige d'avoir des parametres non alignes sur la pile, puisque I'adresse de retour d'une sous-routine est sur 
3 octets. 

Le probleme ne se pose done que pour les structures, puisque le compilateur place normalement chacun 
des membres a I'adresse suivant imm§diatemment celle du membre precedent dans la structure, ce qui peut 
done provoquer des fautes d'alignement. Certains compilateurs permettent de forcer I'alignement des 
membres. Ceci presente toutefois I'inconvenient de gonfler la taille de la structure, et de compliquer 
I'interchangeabilite" des donnees avec une autre machine qui ne disposerait pas d'un compilateur effectuant 
la meme operation. En gros, cela interdit I'enregistrement direct d'une structure dans un fichier, si on 
compte reutiliser ce fichier sur une autre machine. De toute fagon, ce n'est pas une tres bonne idee de 
stocker directement une structure dans un fichier, notamment a cause des problemes d'ordre des octets dans 
un mot ou un mot long. 

Heureusement, il existe une solution simple a tous ces problemes, des lors que I'on respecte la regie 
suivante : les membres d'une structure doivent etre specifies dans I'ordre d6croissant de leur taille. 

Par exemple, si je dois creer une structure comprenant 2 longs et 2 shorts, je la definirai ainsi : 

struct { 

long 11, 12; 
short s1, s2; 

}; 

Pour les structures, les compilateurs des machines concernees garantissent qu'elles seront alignees sur 
une fonctiere de 32 bits. Par consequent, les membres de la structure precedente seront bien alignes sur un 
multiple de leur longueur. 

Les membres d'une structure devront done respecter I'ordre suivant : "double" (64 bits), "long" et 
"float" (32 bits), "short" (16 bits) et "extended" (80 bits, soit 5 short), "char" et "string". Si la 
structure comprend un tableau, on le mettra de preference a la fin. Si il y a en plusieurs, on essayera de 
faire en sorte que la taille totale de chaque tableau soit un multiple de 16 ou 32 bits (ie pour une chaTne, un 
nombre pair de caracteres), et on les mettra dans I'ordre decroissant de I'alignement (c'est a dire d'abord 
les multiples de 32 bits puis ceux de 16 bits). 

Cette regie est bien sur amSnageable, de fagon a prendre en compte le desir d'organiser les membres 
'logiquement' en fonction de ce qu'il representent : il suffit de les compacter dans un "long". Par exemple, 
I'exemple pr§c§dent peut aussi etre ecrit des 2 fagons correctes suivantes : 

struct { struct { 

long 11; short s1, s2; 

short ft, s2; long 11, 12; 

long 12; }; 

}; 
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En revanche, il faut absolument eviter d'utiliser les 2 formes : 



struct { 

long 11; 

short s1 ; 

long 12; 

short S2; 

}; 



struct { 

short s1 ; 
long 11; 
short s2; 
long 12; 

}; 



Utilisation des structures 
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On ne peut r£aliser que tres peu d'op£rations sur la totality d'une structure : affecter une variable de type 
structure a une autre variable du meme type structure, obtenir I'adresse de cette variable structure en 
m£moire (nous y reviendrons lorsque nous parlerons des pointeurs), passer une structure en parametre a 
une fonction (ce qui revient en quelque sorte a une affectation), et retoumer une structure comme resultat 
d'une fonction. 

Toutefois, le passage d'une structure en parametre a une fonction par valeur (ce qui est la seule 
possibility en C) correspondant au passage de chacun de ses membres, on a tendance a plutot passer I'adresse 
de cette structure a la fonction (meme si on n'a pas I'intention de la modifier), notamment lorsqu'elle 
comprend beaucoup de membres. Dans le cas contraire, chacun des membres doit etre empile un par un, ce 
qui peut couter cher en temps et en place sur la pile. 

On peut utiliser le meme principe pour retourner une structure, c'est a dire qu'on retourne un pointeur 
sur la structure plutot que la structure elle-meme; ce cas pose cependant un probleme : si la structure est 
d£claree localement a la fonction, elle a ete allouee sur la pile, et I'adresse n'est plus valide apres le retour 
(plus pr£cisemment, elle correspond a une partie de la pile qui se situe avant son sommet); on declarera 
done une telle structure en "static", mais cela oblige a la recopier apres I'appel, car elle sera ecrasee au 
prochain appel a la fonction. De toute fagon, c'est ce qui aurait ete fait si on avait retournS la structure 
directement. 

L'op£ration que Ton realise le plus avec les structures est bien 6videmment I'acces a ses differents 
champs. On dispose pour cela de l'operateur specifique "." (le point, comme en Pascal). Un champ est alors 
represents" ainsi : variable.champ, la variable designant une structure. Si le champ est lui meme une 
structure, on continue jusqu'a acceder a un champ de type eiementaire ou tableau. Avec la structure 
"personne" definie precedemment, si je veux acceder au jour de la naissance d'un individu, j'ecrirai : 

individu.naissance.jour 

Cette operation consiste a qualifier le membre par la structure a laquelle il appartient. A partir de la, le 
membre s'utilise comme une variable scalaire du meme type. 

L'operateur "." est lvalue de gauche a droite (on dit qu'il a une associativa gauche-droite). L'exemple 
precedent correspond done a "(individu. naissance).jour". L'operateur "." est aussi celui qui a la plus forte 
precedence (priority), avec notamment les "()". 

II est a noter que C ne dispose pas destruction "WITH" a la Pascal. Ceci signifie que Ton doit toujours 
qualifier tous les membres par le nom des structures auxquelles ils appartiennent. 

L'operateur "sizeofQ" permet d'obtenir la faille d'une structure en octets. Cet operateur n'est pas 
specifique aux structures, mais il est souvent utilise avec elles. II est plus que recommande d'utiliser cet 
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operateur pour evaluer la taille d'une structure (d'autant que cette evaluation est effectuee au moment de la 
compilation et non pendant I'execution), et non de fixer la taille en cumulant celles des membres, car la 
structure peut avoir des trous entre les membres, notamment lorsque Palignement a ete force par le 
compilateur. 

La macro "offsetof()" definie dans "stddef.h" permet d'obtenir le decalage en octets entre un membre et 
le debut de la structure qui le contient. 
Par exemple, dans la structure : 

struct { 

long ml; 

short m2; 

char m3; 
} x; 

offsetof(x,m1) vaudra 0, offsetof(x,m2) vaudra 4 et offsetof(x,m3) vaudra 6. 



Champs de bits 






II est classique de regrouper des flags n'utilisant que deux valeurs (0 et 1 pour faux et vrai) a I'interieur 
d'un meme mot. Pour cela, on definit des masques, comme par exemple : 



#deflne F1 


0x01 


#define F2 


0x02 


#define F3 


OxCO 



On utilise alors les instructions bit a bit pour les manipuler (bien entendu chacun des flags doit 
correspondre a des puissances de 2 de fagon a occuper des bits differents). Tout ceci ne presente pas de 
difficult^ particuliere. 

Cependant, C permet d'acceder a des bits quelconques d'un mot sans requerir I'utilisation des instructions 
de manipulation de bits. Pour cela, on utilise des "champs de bits" ("bit fields" en anglais) qui permettent 
de representer un ensemble contigu de bits, et dont I'unite d'alignement est le bit et non plus I'octet. ORCA/C 
permet de definir des champs ayant jusqu'a 32 bits (sur d'autres machines, la limite peut etre de 16 bits). 
w Ainsi nos flags precedents peuvent etre declares ainsi : 



struct { 








unsigned 


f3 


: 2; 




unsigned 




:4; 




unsigned 


f2 


: 1; 




unsigned 


f1 


: U 


} 


flags; 







La syntaxe est la suivante : la definition des champs de bits doit se faire a I'interieur d'une structure; 
pour chaque champ on lui donne eventuellement un nom et une taille en bits separes par un ":". Le mot clef 
"unsigned" indique que le champ est non signe (ORCA/C autorise des champs de bits signes, mais je ne vois 
pas tenement I'interet). Si on ne donne pas de nom, cela permet simplement de marquer des bits non utilises 
(on cree un "filler" en anglais), que Ton ne pourra done pas acceder par la suite. 

Je suis parti du dernier flag, car ORCA/C alloue les bits de gauche a droite, e'est a dire en partant du plus 
significatif dans un octet, et de I'octet de poids faible (qui est le premier en memoire) pour un mot de 16 ou 
32 bits. 



Chapitre 6 page 8 



Initiation C - Chapitre 6 
Ce n'est pas le cas de toutes les machines (cela peut etre exactement le contraire, notamment sur les 
680x0). II faut done etre prudent quand on enregistre un champ de bit dans un fichier; il est souvent 
souhaitable de I'etendre a un octet dans ce cas. 

Avec cette definition, fl peut avoir la valeur ou 1 et correspond au bit de I'octet, f2 est le bit 1, et f3 
les bits 6 et 7; il peut prendre les valeurs de a 3. 

On accede a ces champs de la meme maniere que les autres membres d'une structure, par exemple flags.f1 
... lis sont consideres comme des entiers a part entiere et peuvent done etre employes dans une expression 
arithmetique. 

Je peux done ecrire : 

flag.f3 = 1 + flag.fi; 

Si le resultat est plus grand que ce que peut representer le champ de bits, il sera tronque. 

Les champs de bits peuvent etre melanges avec la definition d'autres membres d'une structure. II est en 
effet frequent de trouver des definitions similaires a : 

struct { 

string nom, prenom; 

unsigned celibataire : 1; 

unsigned marie : 1; 

unsigned divorce : 1; 

unsigned veuf : 1; 

unsigned enfants : 4; 

unsigned char age; 
} individu; 

Dans cette structure, j'ai utilise un bit different pour representer la situation sociale d'un individu 
(e'est soit loin d'etre la meilleure solution car ces situations sont exclusives, et done 2 bits suffisent au 
lieu de 4; mais bon, e'est un exemple I), 4 bits pour indiquer le nombre d'enfants (ce qui lui permet d'en 
avoir jusqu'a 15) et un octet pour Cage. 

Cette definition permet de compacter toutes ces informations dans un meme mot de 16 bits tout en donnant 
un nom a chacune d'entre elles. Un champ de bits peut done etre utilise aussi pour representer un petit 
nombre entier, ou un nombre n'occupant pas un nombre entier d'octets (par exemple un nombre ne 
necessitant que 10 bits), et pas uniquement des flags. 

Si mes champs de bits n'avaient pas occupe un octet entier, I'age aurait quand meme ete aligne sur une 
frontiere d'octet (e'est I'alignement minimum quelque soit la machine), mais j'aurai aussi pu le declarer 
en "unsigned age : 8" pour forcer le compactage. 

Les autres membres d'une structure etant alignes sur une frontiere d'octet, il ne faut pas intercaler les 
champs de bits et les autres membres (par exemple bit, short, bit), sinon on perd tout le benefice du 
compactage. 

Les champs de bits doivent aussi respecter la regie d'alignement que j'ai indique ci-dessus; il est done 
d'usage de les regrouper tous ensemble et de les faire voisiner avec des chars ou des short de fagon a former 
un long. 

Si un champ de bits ne peut etre inclus dans le mot long courant, e'est a dire que sa taille le force a 
chevaucher 2 mots longs, il est realigne a la frontiere du mot long suivant. On peut forcer ce changement de 
mot en codant un champ de bits de taille 0. 
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Un champ de bits n'a pas d'adresse (on ne peut pas utiliser I'operateur "&" avec ces membres, et par 
consequent la macro u offsetof()" non plus), et nepeut etre represents autrement que par une structure. 
Enfin, un champ de bits n'est pas un tableau de bits. 

II est bien Evident que I'acces a des champs de bits est assez couteuse, puisqu'ils ne servent qu'a masquer 
les manipulations de bits qu'on devrait faire par ailleurs si on avait utilise" des entiers et des masques. Mais 
ils ont quand meme leur utility. 



Unions 



Dans une structure, chacun des membres est stocks immediatemment apres le membre precedent. II est 
parfois utile d'associer plusieurs types a une meme adresse. Dans ce cas, on utilise une "union". 

Une "union" est similaire a la partie variable d'un record Pascal, que Ton declare avec un "CASE OF". 
Elle n'en a toutefois aucune des restrictions. 

La syntaxe d'une "union" est identique a celle d'une "structure", excepte qu'elle ne peut contenir de 
champs de bits. Les autres regies stipules precedemment pour les structures s'appliquent pareillement aux 
unions. De meme I'acces aux membres d'une union est identique a ceux d'une structure, c'est a dire qu'on 
utilise I'operateur ".". Une structure peut inclure une union (c'est le cas le plus frequent) et une union 
peut aussi inclure une structure. 

La seule difference entre une structure et une union se situe au niveau de la maniere dont la memoire est 
allouee aux membres. Dans une structure, chaque membre occupe une adresse consecutive, et la taille de la 
structure est la somme des tallies des membres; dans une union, chaque membre occupe la meme adresse, et 
la taille de I'union est celle du plus grand de ses membres. A un instant donne ou pour une variable du type 
de cette union, un seul des types des membres est valide. 

Voyons tout ga sur un exemple : 

struct { union { 

long I; long I; 

float f; float f; 

short s; short s; 

} s; } u; 

Dans la structure, le membre "I" est a I'adresse 0, "f" est I'adresse 4 et "s" a I'adresse 8; la taille de la 
structure est de 10 octets. Pour I'union, "I", T et "s" sont tous a I'adresse et la taille de I'union de 4 
octets. 

Un exemple plus concret pourrait etre : 

typedef struct { 

enum { entier, reel } type_nombre; 
union { 

long val_entiere; 
long val_reelle; 
}val; 
} nombre; 
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Cette structure permet de representer un nombre entier ou reel. Le membre "type_nombre" indique le 
type du nombre et, par consequent, quelle valeur utiliser dans I'union. Si on n'avait pas ce premier 
membre, on ne pourrait determiner si le nombre est un entier ou un reel, ni quel membre de I'union est 
utilisable, a moins de disposer de cette information par ailleurs. 

Un dernier exemple : 





union { 




long 
struct { 

short n; 




unsigned x : 4; 

unsigned f1 : 1; 

unsigned f2 : 2; 
unsigned : 1; 
char c; 




}s; 
} u; 



Ce type de definition permet de representer un ensemble d'informations occupant 32 bits et de lui 
associer un long. Les operations de copie, passage de parametre ... seront beaucoup plus efficaces en utilisant 
le long plutot que la structure associee. En meme temps, les acces aux differents membres de la structure 
restent simplifies, en ne necessitant pas de masques ni de manipulation de bits. 

On peut initialiser le premier membre d'une union en faisant suivre la declaration de la variable du type 
de cette union, du signe "=" et la valeur desiree. Ceci requiert que le premier membre soit initialisable. 

Dans I'exemple precedent, je pourrai ecrire "union ... u = 0"; si j'avais inverse le "long" et la 
"structure", j'aurais du initialiser chacun des membres de la structure. 
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Chapitre 7 



Les Tableaux et les Pointeurs 



Comme je I'ai laisse sous-entendre dans mon precedent article, il y a une tres forte relation en C entre les 
tableaux et les pointeurs. II etait done naturel d'aborder ces 2 aspects du langage simultanement. 

Cependant, et j'ai deja eu plusieurs fois I'occasion de I'ecrire, les pointeurs jouent un role tres important 
dans le langage C; il n'est done pas possible de dScrire tout ce que Ton peut faire avec les pointeurs dans un 
seul article. Par consequent, nous nous contenterons de ne faire qu'une premiere approche des pointeurs 
dans cet article, tandis que nous en ferons une 6tude plus approfondie dans le prochain. 



Definition d'un tableau 



A priori, les tableaux en C semblent assez rudimentaires, notamment par rapport aux possibilites 
offertes par Pascal. Ainsi, lorsqu'on declare un tableau, la seule chose que Ton doive indiquer, e'est sa 
taille, comme par exemple : 



int tableau[10]; 

Cette definition va reserver en me" moire un bloc permettant de stocker 10 entiers (de 2 octets chacun) les 
uns a la suite des autres, e'est a dire que ce tableau occupera 20 octets de m§moire. Dans cet exemple, j'ai 
declare un tableau d'entiers, mais, bien entendu, tout autre type, qu'il soit predefini ou bien defini 
prealablement a la declaration du tableau, peut etre utilise, et notamment un type structure ou union, tels 
que nous les avons vus dans le pre'ee'dent GS Infos. Le seul type qu'on ne peut pas utiliser est le type fonction; 
on ne peut done pas d&inir de tableaux de fonctions. 

On declare done un tableau de la meme maniere qu'une variable simple, sauf qu'on specifie en plus le 
nombre d'6l6ments qu'il doit comporter, cette taille £tant indiqu^e entre crochets ("[]"). La taille du 
tableau doit etre obligatoirement une constante entiere, ou une expression pouvant etre evaluee par le 
compilateur et dont le resultat est done constant. Ceci implique que tous les 6l§ments d'un tableau sont du 
meme type. 

On peut aussi d^finir un nouveau type tableau avec "typedef". Par exemple : 

typedef int inttabl 0[1 0] ; 

definit un type "inttabl 0" permettant ensuite de declarer des tableaux de 10 entiers, comme : 

InttablO It, t2; 

On peut constituer des tableaux de structures, par exemple : 

struct { 

int x, y; 
} coords[100]; 

Chapitre 7 page 1 



w 



^ 






Initiation C - Chapitre 7 

et declarer un tableau a I'int6rieur d'une structure : 

struct { 

int tab[10]; 
} s; 

Attention : il faut veiller a la taille des tableaux que vous allouez, car, par d§faut, la taille maximale d'un 
programme est de 64K octets; si vous avez besoin de plus de m§moire, il vous faut soit faire des allocations 
dynamiques (nous en reparlerons dans le prochain article), soit utiliser un autre modele de mSmoire (voir 
le manuel d'ORCA/C a ce sujet). 



II faut etre extremement prudent pour les tableaux declares en variables locales, car ils sont alors allouSs 
sur la pile, qui est une ressource tres limine sur le GS. 

Pour eviter tout probleme, je vous conseille de declarer vos tableaux soit en global, soit en utilisant 
I'attribut "static" si vous les declarez localement a une fonction. 



Initialisation d'un tableau 

Lors de la declaration d'un tableau, il est possible, comme avec toutes les autres variables, d'affecter une 
valeur a chacun des elements. La syntaxe est identique a celle que nous avons vu avec les structures, c'est a 
dire une liste de constantes (ou depressions constantes) separGes par des virgules et encadrees par des 
accolades ("{}"), par exemple : 

Int tab[10] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 

Toutefois, I'initialisation d'un tableau connait quelques regies particulieres : 



• II n'est pas necessaire de donner une valeur a chacun des elements. Dans ce cas, les Elements non 
initialises se verront affecter la valeur par le compilateur. 



• Lorsqu'on initialise un tableau, il n'est pas obligatoire d'indiquer explicitement sa taille, le 
compilateur la calculant automatiquement en fonction du nombre de constantes d'initialisation spe'cifie'es. 
Ainsi, I'exemple precedent peut aussi etre §crit : 

Int tab[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 

Les crochets restent obligatoires pour indiquer au compilateur qu'il s'agit d'un tableau; il de"terminera 
toutefois tout seul qu'il y a 10 elements dans ce tableau. 

Bien entendu, cette regie ne peut pas etre appliqu6e en meme temps que la pre"cedente; je vous laisse 
chercher pourquoi si cela ne vous parait pas Evident. 



• Les tableaux de caracteres constituent un cas particulier. En C, il n'y a pas de type "string" (chame de 
caracteres) a proprement parler. A la place, on utilise des tableaux de caracteres. Toutefois, le langage 

permet d'6"crire une chame constante d'une fagon speciale en la delimitant par des ". On peut done 

initialiser un tableau de caracteres avec une chaine, par exemple : 



i-J 
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char str[] = "Ceci est une chaine"; 



Le compilateur rajoute automatiquement un octet a "0" a la fin puisque c'est une chaine de caracteres. Le 
tableau comprend done un 6lem6nt de plus que le nombre de caracteres de la chaine. II est done souhaitable de 
ne pas dimensionner le tableau explicitement, afin de ne pas se tromper (voir ci-apres pour plus de details 
sur ce point). 

On peut cependant aussi vouloir initialiser un tableau de caracteres sans avoir cet octet a "0" final. II 
suffit alors d'employer la meme syntaxe que pour les autres types : 

char tabc[] = { 'a', 'b\ 'C }; 

II n'est pas non plus obligatoire de donner la faille d'un tableau lorsqu'on declare ce tableau sans le definir 
(c'est a dire que Ton ne reserve pas de mSmoire). 
C'est le cas lorsqu'on effectue une reference externe : 

extern Int tab[]; 

ou lorsqu'on passe un tableau en parametre a une fonction : 

void f ( Int tab[] ) 

{ 



} 

Comme le compilateur ne fait aucun controle par lui-meme (voir plus loin), le fait d'indiquer ou non la 
taille du tableau externe ne change pas grand chose. Dans un cas comme dans I'autre, c'est a vous de faire 
attention. 






<J> 



Acces aux elements d'un tableau 



Une fois que Ton dispose d'un tableau, il nous faut pouvoir acceder a chacun des elements qui le composent. 
Pour cela, on utilise un m£canisme que Ton dSsigne sous le nom d'index ou d'indice. Ainsi, chacun des 
elements d'un tableau sera accede par son numSro d'index, qui, en C, d§marre TOUJOURS de 0. On utilise la 
meme syntaxe que pour declarer le tableau, c'est a dire que Ton donne le nom du tableau suivi de I'indice de 
I'etement voulu entre "[]". Avec I'exemple ci-dessus, on aura done tableau[0], tableau[1], ..., tableau[9]. 
En fait, I'index reprSsente la position de I'§l6ment par rapport au d6but du tableau. Un index est 
obligatoirement une constante, une variable ou une expression entiere; on peut toutefois utiliser des entiers 
courts ou longs en fonction de la taille du tableau. 

II est tres important de bien comprendre ce principe d'indexation d'un tableau en C, car il est souvent 
cause d'erreurs et par consequent, de plantages du programme : puisque I'index d'un tableau commence 
toujours a 0, I'index du dernier Element du tableau est done egal au nombre d'elements - 1. Ainsi, dans 
notre exemple, il n'y a pas d'e" lament d'index 10. Vous pouvez vous en convaincre en v6rifiant que de a 9, 
il y a bien de^'a les 10 elements demandes lors de la declaration du tableau. Done, tableau[10] n'existe pas ! 
Toute tentative de modification de cet element va en fait ecrire dans une zone memoire inconnue : cela peut 
etre une variable adjacente dans votre programme, mais cela peut aussi etre I'adresse de retour dans la pile 
ou une zone memoire appartenant a un autre programme. 
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Malheureusement, c'est un pi&ge dans lequel on tombe tres facilement. En effet, en regardant la taille du 
tableau, on se dit que I'index va jusqu'a 10 alors qu'il ne va reellement que jusqu'a 9. II n'y a pas de remede 
miracle, si ce n'est qu'il faut faire tres attention. 

C'est d'autant plus frustrant que C n'offre aucun mecanisme de validation des index lors de I'exScution du 
programme, et que le plantage peut avoir lieu ou pas selon la zone memoire 6crasee. 

En general, un tableau est manipuie dans une boucle, et il faut alors etre prudent sur la facon de faire 
varier I'index dans cette boucle. Avec notre exemple precedent, je peux initialiser mon tableau de la 
maniere suivante : 

for ( i = 0; I < 10; I++ ) 

tableaup] = i; 

Notez bien la condition d'arret de la boucle : I'instruction "tableau[i] = i" est executee tant que "i" est 
strictement inferieur a 10. L'erreur la plus classique est d'6crire la boucle de cette maniere : 

for ( i = 0; I <= 10; i++ ) 

tableau[l] = i; 

J'espere que vous avez bien compris le probleme. Une autre cause d'erreur potentielle vient de la 
mauvaise utilisation des operateurs decrementation et de decrementation. Par exemple : 

for ( i = 0; I < 10; tableau[i] = I++ ); 

lei, vous ne savez pas qui sera evalue" en premier entre "tableau[i]" et "i++"; si c'est le deuxieme 
membre (ce qui est fort probable), lorsque T vaudra 9, I'expression sera alors interpreted comme 
"tableau[10] = 9", et vous aurez un probleme : le T utilise comme index sera lvalue apres avoir ete 
incremente. 



Si vous connaissez le langage Pascal, vous devez vous dire que pour une fois C n'est pas tres sophistique. 
Vous avez en partie raison. D'un autre cote, il faut bien voir qu'une fois traduit en langage machine, un 
tableau est tel que C le represente : une zone memoire contigue dont le premier element est a la meme 
adresse que le debut du tableau, et done a la position 0. C'est a dire qu'il y a une transcription directe entre 
la representation C et la representation machine du tableau, ce qui est coherent avec les autres concepts du 
langage. C'est aussi a cause de cette limitation apparente qu'il y a une equivalence directe entre les tableaux 
et les pointeurs. 

Lorsqu'en Pascal, on declare un tableau d'indice quelconque commengant a n'importe qu'elle valeur, le 
compilateur doit generer du code supplemental pour effectuer la transcription entre la forme evoluee et 
Padresse en memoire, ce qui a un cout non negligeable en general. De la meme maniere, les controles 
d'indices effectues pendant I'execution d'un programme Pascal sont le fait destructions rajoutees au 
programme, ce qui a aussi un impact sur la taille et la vitesse du programme (bien entendu on peut toujours 
les enlever). 

Dans un prochain article de ma serie "Programmation" que je consacrerai aux techniques de mise au 
point (debugging), je vous montrerai notamment comment effectuer des controles d'indices en C equivalents 
a ce que fait le compilateur Pascal. 



<w 
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Tableaux a plusieurs dimensions 

C ne permet pas vraiment de declarer des tableaux a plusieurs dimensions; a la place, on peut declarer des 
tableaux de tableaux, c'est a dire que chaque element du premier tableau est un tableau, les elements de ce 
second tableau etant les donnees elles-memes. Ce qui se fait de la maniere suivante : 

Int tab[lO][lO]; 

C'est a dire que Ton specifie chacune des dimensions en leur donnant une taille stipulee entre crochets. 
Cette maniere de proceder revient a peu pres a la meme chose qu'un tableau a plusieurs dimensions, et a 
part la difference de syntaxe, un tableau de tableau s'utilise de la meme maniere qu'un tableau a plusieurs 
dimensions. II n'y a pas de limites particulieres au nombre de dimensions que Ton peut declarer, mais au 
dela de 3 ou 4, cela devient difficilement gerable pour le programmeur. 

Le tableau d§fini ci-dessus occupera 10 * 10 * 2 = 200 octets. 

On accede aux elements de ces tableaux en indiquant chacun des index, eux aussi encadr§s par des crochets. 
Le tableau precedent varie done de tab[0][0] a tab[9][9]. 
Je peux done ("initialiser avec la boucle imbriquee suivante : 

for ( I = 0; i < 10; i++ ) 

for ( j = 0; j < 10; j++ ) 
tab[i][j] = i * j; 

Un tel tableau est stocke en memoire de telle sorte que les elements identifies par le dernier indice soient 
consScutifs, ce qui est coherent avec la notion de tableau de tableau; on dit que le tableau est organise par 
lignes. Avec mon exemple, j'aurai done en memoire successivement tab[0][0], tab[0][1], ... tab[0][9], 
tab[l][0] et ainsi de suite. 



w 
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On peut aussi initialiser un tableau a plusieurs dimensions; on procede alors de la maniere suivante : 

int tab[2][5] = { { 1,2,3,4,5}, { 6,7,8,9,10} }; 

Avec cette methode, chaque sous-tableau est bien initialise par les valeurs, le tableau de tableau etant lui 
initialise par les listes de valeurs de chacun des sous-tableaux. 

Les memes regies que celles listees precedemment s'appliquent, on y ajoute nSanmoins une quatrieme 
regie : 

• On peut supprimer les accolades delimitant les sous-tableaux si I'ensemble des elements sont 
initialises. L'exemple precedent devient alors : 

int tab[2][5] = { 1,2,3,4,5,6,7,8,9,10}; 

Dans le cas ou on ne specifie pas les dimensions du tableau explicitement, il faudra bien entendu utiliser 
les accolades separant chaque sous-tableau afin que le compilateur sache comment acceder a chacun des 
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elements. 

Lorsqu'on reference un tableau declare par ailleurs ou qu'on declare un parametre formel, il est possible 
d'omettre la taille de la premiere dimension (c'est a dire celle du tableau englobant les sous-tableaux), car 
le compilateur n'en a pas besoin pour calculer I'adresse de Tenement en mSmoire, c'est a dire que je peux 
ecrire : 

extern int tab[][iO] 

mais pas 

extern int tab [10][] 

En effet, pour I'element 

tab[l][j] 

I'adresse sera obtenue parle calcul suivant : 

i * nombre de colonnes (Elements du tableau de droite) * taille d'un 6l§ment en octets + j * taille element 
en octets. Avec I'exemple precedent, tab[1][3] aura I'adresse (relativement au debut du tableau) : 1 * 5 *2 
+ 3 * 2 = 16. 



II est important de connaitre I'ordre de progression des indices dans un tableau a plusieurs dimensions, 
meme si cela n'a pas tenement d'importance sur le GS ou sur d'autres micro-ordinateurs avec des systemes 
d'exploitation simples. En revanche, sur des machines et des systemes plus sophistiques implementant un 
mScanisme appelS 'm6moire virtuelle', cela est extremement important. 

En effet, I'acces a deux elements du tableau dans le mauvais ordre peut provoquer, si le tableau est grand, 
ce que Ton appelle une laute de page', c'est a dire que la page contenant I'adresse en question n'est pas en 
memoire, et qu'il faut aller la chercher sur disque (ce ph^nomene s'appelle la 'pagination'), en general au 
detriment d'une page qui est elle en m§moire et que Ton va sauver sur disque a la place de celle dont on a 
besoin. Le probleme est que lorsqu'on va acceder a Tenement voisin du premier, la page le contenant a peut 
etre ete supprimee, d'ou une nouvelle faute de page ... Les performances du programme s'en ressentent tres 
significativement. Sur un cas vecu, cela etait dans un rapport 10, c'est a dire que I'acces a un tableau d'un 
megaoctet dans le mauvais ordre des indices 6tait 10 fois plus lent que dans le bon ordre. 

En C, cela signifie qu'il faut d'abord faire progresser I'indice le plus a droite dans la boucle la plus 
imbriquee. En effet, tab[i][j+1] est consecutif en memoire a tab[i][j] tandis que tab[i+1][j] est distant de 
tab[i][j] du nombre d'6l6ments de la deuxieme dimension multiplie" par la taille de chaque 6l6ment en octets. 



Si vous voulez etudier un exemple concret d'utilisation des tableaux, je vous recommende de vous 
repencher sur le programme "Crypt" que j'avais §crit pour accompagner la quatrieme partie de cette 
initiation. Vous le trouverez sur le numero 19 de GS Infos. 



Pointeurs 



Un pointeur est une variable dont le contenu n'est pas une donnee (comme les autres types de variables), 
mais I'adresse d'une autre variable, ou plus gen^ralement I'adresse d'une donn6e quelque part en memoire. 
Dans le cas du GS, qui a un adressage sur 24 bits, un pointeur est repr£sente par un entier long non signe 
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sur 32 bits, car le GS ne manipule pas de donnSes sur 24 bits (mis a part I'adresse de retour d'une 
sous-routine). Cet entier long represente done une adresse dans I'espace adressable du GS; I'octet de poids le 
plus fort est done toujours egal a 0. 

Cependant, un pointeur n'est pas un entier et il taut done eviter de faire des conversions de types entre 
les 2, meme si cela ne change en general rien a la valeur du pointeur. 

Les pointeurs jouent un role tres important en C, et il difficile d'ecrire un programme pouvant s'en 
affranchir; d'ailleurs, j'ai d§ja du en dire quelques mots dans mes articles precedents, notamment pour le 
passage de parametres par reference. 

Les pointeurs jouissent par ailleurs d'une assez mauvaise reputation, car ils permettent de realiser des 
programmes incomprehensibles. C'est vrai si on ne les utilise pas avec un minimum de soins; il est 
notamment tres facile de creer des pointeurs qui ne pointent nulle part, et done de planter le programme 
lorsqu'on les manipulent. 

En revanche, ils permettent souvent d'ecrire des programmes plus efficaces et plus simples, voire meme 
parfois plus clairs que si on ne les utilisait pas. Je vais done essayer de vous apprendre les bonnes manieres 
pour les utiliser. 

Declaration et utilisation d'une variable pointeur 



Un pointeur sur une variable d'un type donne se declare en precedant le nom de la variable par le symbole 
"*"; par exemple : 

int *p; 

declare un pointeur p sur une variable entiere. Pour Pinstant ce pointeur ne pointe sur rien; il faut done 
lui affecter I'adresse de I'objet sur lequel il pointe, ce qui se fait par I'operateur unaire "&", soit par 
exemple : 

int i, *p; 
P = &i; 

En fait, comme pour toutes les autres variables, un pointeur doit etre initialise avant de pouvoir etre 
utilise. La difference principale est que Putilisation d'un pointeur non initialise est plus risqu6e que celle 
d'une variable non initialis£e, puisque cela va acceder a une zone memoire inconnue, et peut done planter le 
programme selon la zone referenced ou modifiee inconsiderement, notamment si I'adresse contenue dans le 
pointeur correspond a I'espace d'entrees-sorties. 

L'operateur "&" ne peut etre utilise qu'avec un objet ayant une adresse, c'est a dire en gros une variable; 
dans un precedent article, un tel objet etait d£sign£ sous le nom de "valeur-g". Je ne peux done pas prendre 
I'adresse d'une constante ou d'une expression. En general, il n'est pas non plus possible de prendre I'adresse 
d'une variable affectee a un registre; comme le 65C816 ne dispose pas d'assez de registres, ORCA/C ignore 
cet attribut, que de toute facon, je vous conseille de ne pas utiliser, les compilateurs actuels determinant 
eux-memes ce qui doit etre mis dans des registres ou pas. ORCA/C permet done d'obtenir I'adresse d'une 
variable declare comme devant etre stockee dans un registre. 

II existe une adresse speciale en C, c'est I'adresse 0. Un pointeur ayant cette valeur ne pointe sur rien, ce 
qui n'est pas la meme chose qu'un pointeur non initialise, qui lui pointe sur quelque chose, sauf que Pon ne 
sait pas quoi. Cette adresse est Pequivalent de NIL en Pascal, et on a Phabitude en C de lui associer un nom 
avec le preprocesseur : NULL. Ce nom est defini dans les fichiers header standards du C : stddef.h et stdio.h, 
ainsi que dans le header specifique au GS : types.h. Toutefois, il faut bien faire attention que contrairement 
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au Pascal ou NIL est un mot clef du langage, NULL est simplement la definition d'un symbole associe a 
I'adresse 0. Ceci etant dit, on ('utilise exactement de la meme maniere. 

Le symbole "*" utilise precedemment pour declarer un pointeur est aussi employe comme operateur 
unaire pour acceder a la valeur de la variable pointee. Ainsi : 

*P = 0; 

est identique a : 
i = 0: 



Cette operation d'acces a une variable pointee s'appelle le 'derSterencement'. De la meme maniere que Ton 
ne peut prendre I'adresse que d'une "valeur-g", on ne peut dereferencer un objet que s'il a une adresse, 
c'est a dire qu'il doit s'agir d'une "valeur-g". 

L'operateur "*" doit etre utilise avec une variable de type pointeur et contenant I'adresse d'une autre 
variable qui peut etre d'un type quelconque mis a part un champ de bit. Cela peut notamment etre aussi une 
variable de type pointeur, creant ainsi une indirection multiple. On accede alors a la donnee reelle en 
indiquant autant d"'*" que d'indirections, par exemple : 

**p = 0; 

Lorsque le type de base utilise pour declarer la variable pointee est "void", comme dans : 
void *p; 

on definit ce que Ton appelle un pointeur generique, c'est a dire qu'il ne pointe pas sur une donnee 
precise. Pour pouvoir le dereferencer, il faudra effectuer un "type cast" afin de determiner le type precis 
de la donnee a acceder. En revanche, on peut affecter a ce type de pointeur n'importe quel autre type de 
pointeur et vice-versa : il est universel. 

Un pointeur etant une variable comme les autres, il peut etre affecte a un autre pointeur, a condition 
qu'ils soient de meme type ou que le pointeur cible soit universel. Dans le cas contraire, on peut recourir a 
un cast, mais cela n'est pas sans risque, car le type de la variable pointee indique comment la memoire sera 
accedee, notamment pour le nombre d'octets a traiter. Par exemple : 

int *pl, *p2, i; 

P1 = &i; 
p2 = P 1; 
*p2 = 0; 

lei, "i", "pr et "p2" ont tous la meme valeur. L'affectation de pointeurs est done identique a 
I'affectation de variables de tout autre type. 

Une variable pointee s'utilise exactement de la meme maniere qu'une variable simple, et peut done 
participer a la constitution d'une expression quelconque valide pour le type de la donnee pointee. Par 
exemple : 

j = *P * 3 + i; 

La seule difficulty est de bien differencier les usages de l'operateur "*" qui sert a la fois a la 
multiplication et au dereferencement d'un pointeur. Un autre probleme peut se poser a cause de la priorite 
(precedence) des operateurs "*" et "&" : ils ont une priorite superieure a celle des operateurs 
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arithmetiques. Ainsi, dans : 

i = *P + 1; 

le pointeur "p" est d'abord dereference, puis on ajoute un a la variable sur laquelle il pointe avant 
d'affecter le resultat final a "j". L'expression 

i = *(p + 1) 

a aussi un sens en C, bien que totalement different, comme nous allons le voir un peu plus loin. 

II est possible d'utiliser avec les variables pointees I'ensemble des operateurs que nous avons vu dans les 
articles precedents, comme par exemple : 

*P += 2; 

ou 

(*p) + + ; 

Les parentheses autour du dereterencement viennent du fait que les operateurs decrementation et de 
decrementation ont une priorite identique a celle de I'operateur "*", et que tous ces operateurs sont evalues 
de droite a gauche. Dans I'exemple precedent, cela signifie que "++" est evalue avant "*" les parentheses 
permettent de changer I'ordre devaluation. Comme tout a I'heure, l'expression 

*P + + ; 

a un sens en C, bien que cela ne realise pas du tout I'operation desir6e ici. 

Pointeurs et tableaux 



J'ai ecrit au debut de cet article qu'il y avait une equivalence entre les tableaux et les pointeurs. Voyons 
maintenant en detail ce dont il s'agit. 

L'operateur "&" permet d'obtenir I'adresse d'une variable. Dans le cas d'un tableau, il permet done 
d'acceder a I'adresse de I'un des elements. Je peux done ecrire : 



int tab[10], *pt, i; 
pt ■ &tab[0]; 

Dans cet exemple, "pt" est I'adresse du premier element du tableau. Par consequent, I'instruction : 

i = *pt; 

copie dans "i" la premiere valeur du tableau. 

II serait interessant maintenant que "pt" pointe sur les autres elements de mon tableau. Bien sur, je 
pourrais ecrire une boucle telle que : 

for ( i = 0; i < 10; i++ ) { 
pt = &tab[i]; 
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traitement impliquant *pt; 

°' j 

mais cela n'apporterait pas grand chose a I'utilisation du tableau. 

Pour resoudre notre probleme, C definit la regie suivante qui est fondamentale pour I'utilisation des 
pointeurs : si un pointeur "pt" pointe sur un element quelconque d'un tableau alors "pt+1" pointe sur 
I'element suivant de ce tableau, et plus gSneralement "pt+i" pointe sur I'element "i" apres "pt" et "pt-j" 
pointe sur Tenement "j" avant "pt", et ce quelque soit le type des elements du tableau, et par consequent la 
taille de ces elements. 



Done, si "pt" pointe sur "tab[0]", alors 

*(pt+1) 

correspond a tab[l], "pt+i" est I'adresse de "tab[i]" et *(pt + i) est le contenu de "tab[i]". 

La definition de I'addition (et par extension toute I'arithmetique des pointeurs) d'un entier a un pointeur 
est telle que la valeur de rentier est ajustee automatiquement par la taille d'un element du type pointe. 
Ainsi, dans I'expression "pt+i", "i" est multiplie implicitement par la taille des elements pointes par 
"pt"; si il s'agit d'entiers courts, le multiplicateur sera 2, tandis que pour une structure quelconque, le 
multiplicateur sera la taille de la structure. 

II est bien evident que I'arithmetique sur les pointeurs represente, a mon avis, I'avantage majeur de C 
sur tous les autres langages (de meme que la correspondance entre les tableaux et les pointeurs). Par 
exemple, en Pascal, ou il n'y a pas de telle arithmetique, pour realiser I'equivalent, on est oblige de 
convertir le pointeur en entier, de lui ajouter I'increment en tenant compte de la taille de reiement, puis de 
reconverts le tout en pointeur. Une expression aussi simple que "pt+i" en C devient en Pascal : 

pointer ( ord4 ( pt ) + i *sizeof(integer) ); 

ce qui est, avouez le, nettement plus lourd. 

J'espere que vous voyez bien maintenant qu'il y a une equivalence totale entre les tableaux et les 
pointeurs. En fait, la plupart des compilateurs C convertissent toutes les references a un tableau par une 
reference a un pointeur sur le debut de ce tableau. Ainsi, le nom d'un tableau est en fait un pointeur sur son 
premier element, et plutot que d'ecrire : 

pt = &tab[0]; 

je peux simplifier en ecrivant : 

pt = tab; 

Cette equivalence a des implications tres importantes; en effet, il est possible d'utiliser les deux syntaxes 
"tab[i] n et "*(tab + i)" de fagon interchangeable. Le choix de I'un ou I'autre est plutot une affaire de gout. 
A mon avis, la premiere forme est plus lisible, et exprime bien que Ton utilise un tableau. 






De la meme maniere, si "pt" est un pointeur sur une zone allouee dynamiquement (nous verrons comment 
dans le prochain article), je peux acceder a cette zone, soit par un pointeur, soit en I'utilisant comme un 
tableau. 
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II y a tout de meme une petite difference : "tab" est effectivement un pointeur, mais celui-ci est constant; 
on ne peut done pas affecter une nouvelle adresse a "tab", ce qui est, en fin de compte, assez logique. Je ne 
peux done pas ecrire : 

tab = pt; 
ni pt = &tab; 

ni aucune autre instruction modifiant "tab". 



Une autre consequence de cette equivalence est que lorsqu'on passe un tableau en parametre a une fonction 
comme dans "f(tab)", on passe en fait son adresse. Dans la fonction, je peux declarer ce parametre 
indifferemment comme un tableau ou comme un pointeur; e'est aussi pour cela qu'il n'est pas necessaire de 
reindiquer la taille du tableau dans la fonction. 



Arithmetique sur les pointeurs 



Vous devez vous demander a quoi peut bien etre utile cette equivalence entre tableaux et pointeurs ? 

Et bien, elle prend tout son sens lorsqu'on utilise I'arithm6tique sur les pointeurs que j'ai introduite tout 
a I'heure. 

Si "p" est un pointeur, alors "p++" incremente "p" de telle sorte qu'il pointe sur r§l6ment suivant en 
memoire quel que soit le type de cet element. De la meme maniere, "p+=i" fait pointer "p" sur le ieme 
element suivant la position courante en memoire; "p--" pointe sur I'element precedent et "p-i" pointe 
sur le ieme element avant. 

Reprenons notre boucle d'initialisation d'un tableau : 

for ( i = 0; I < 10; i++ ) 
tab[i] = i; 

Grace a I'arithmetique sur les pointeurs, je peux tout aussi bien 6crire : 

for ( i = 0; p = tab; i < 10; p++, i++ ) 
*P = i; 

Evidemment, sur un exemple aussi simple, I'avantage des pointeurs n'apparait pas vraiment. Toutefois, il 
est suffisant pour expliquer I'interet de cette technique. 

Dans le premier cas, a chaque tour de boucle, I'adresse de I'element a modifier "tab[i]" doit etre calculee; 
pour ce faire, on multiplie "i" par la taille de I'element et on ajoute ce resultat a I'adresse de debut du 
tableau. 

Dans le deuxieme cas, la seule chose a faire est d'ajouter la taille d'un Element a "p", qui pointe en 
permanence sur I'element a acceder, une seule fois a la fin de la boucle, afin de pouvoir le faire pointer sur 
I'element suivant. 
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Vous imaginez le gain de performance que cela peut representer lorsqu'on manipule un tableau de taille 
beaucoup plus importante que celui-ci, sans compter que dans un programme r6el, il est fort probable qu'on 
accede plusieurs fois a chaque element a chaque passage dans la boucle; il est presque certain que I'adresse de 
retement devra etre recalcuiee a chaque fois qu'on y fait reference. 

L'arithmetique sur les pointeurs permet aussi de faire des comparaisons entre 2 pointeurs, mais 
uniquement dans le cas ou les 2 pointeurs pointent sur le meme tableau; dans le cas contraire, C ne dira 
rien, mais le resultat n'aura aucun sens. 

Done si j'ai 2 pointeurs "pi" et "p2" pointant sur 2 elements d'un tableau "tab", je peux d&erminer 
par exemple si "pr pointe sur un element precedant celui pointe par "p2" ou si les 2 pointeurs sont 
identiques. La boucle precedente peut, par exemple, etre ecrite ainsi : 



for ( p = tab; p < tab + 10; p++ ) 
*P = 0; 

"tab+10" donnerait I'adresse d'un dixieme Element s'il existait; en I'occurence, cela correspond a 
I'adresse immediatement apres le tableau. Par consequent tant que "p" ne pointe pas sur cette adresse, il 
correspond a un element du tableau. 



On peut done notamment comparer un pointeur avec la valeur NULL (0) pour determiner si ce pointeur 
pointe effectivement sur une zone memoire valide ou pas. 

C permet de soustraire 2 pointeurs a condition qu'ils pointent tous deux sur 2 elements d'un meme 
tableau. Avec les memes "p1" et "p2" que tout a I'heure et "p1"> "p2", "p1-p2" donne le nombre 
d'6l£ments entre les 2 pointeurs. A titre d'exemple, voici la fonction de la librairie C standard "strlenQ" 
ecrite en C : 



short strlen ( char *s ) 

{ 

char *p; 

for ( p = s; *p != '\0'; p++ ); 
return ( p - s); 

} 

A la fin de la boucle, "p" pointe sur I'octet a terminant la chaine de caracteres. La difference entre "p" 
et "s" donne par consequent le nombre de caracteres de la chaine. Pour vous en convaincre, executez cette 
fonction a la main sur une chaine quelconque, en partant du principe qu'elle est a I'adresse pour 
simplifier. 

La forme la plus classique d'arithmetique sur les pointeurs est souvent representee par une construction 
du type : 

*P + + 

Comme I'ordre devaluation de ces operateurs est de droite a gauche, I'expression precedente signifie : 
dereterencer le pointeur, puis I'incrementer. Si vous voulez incrementer votre pointeur avant de le 
dereterencer, vous ecrirez alors : 

* + + p 
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En resume, void toutes les operations que Ton peut effectuer avec des pointeurs : 

• Addition ou soustraction d'un entier, y compris auto incrementation et decrementation. 

• Soustraction de 2 pointeurs. 

• Comparaisons entre 2 pointeurs. 

Toutes les autres operations sont iliegales : on ne peut ajouter 2 pointeurs entre eux, ni effectuer de 
multiplication ou de division, ni d'operation bit a bit ... 



Conclusion 



Voila qui conclut notre etude des tableaux et la premiere partie concernant les pointeurs. Dans le prochain 
article, nous aborderons des concepts plus avances sur les pointeurs, notamment leur utilisation avec les 
structures et les fonctions, ainsi que I'allocation dynamique de memoire. D'ici la, bonne lecture ... 
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Chapitre 8 



Les pointeurs et la memoire dynamique 



Avant d'entrer dans le vif du sujet, voici la solution au petit exercice que je vous avais propose dans le 
precedent GS Infos : si vous avez execute le programme, vous vous etes immediatement apergus qu'il 
calculait une valeur approchee de PI. Je dois avouer que je vous ai simplifie la tache par rapport au 
programme original que j'avais obtenu (d'ailleurs il comportait un bug empechant sa compilation); en 
effet, celui-ci affichait 0.26 comme valeur approchee de PI et il fallait done etre devin pour trouver la 
bonne solution. J'ai seulement modifie le coefficient dans instruction comportant le printf : j'ai change le 
4 en 44; comme le programme de depart etait errone, j'ai pense qu'il y avait d'autres erreurs, et e'est 
pourquoi j'ai modifie ce coefficient. 

En dehors de son aspect ludique, ce type de programme a aussi un interet pratique : beaucoup d'auteurs 
s'en servent pour valider leurs compilateurs C; ce genre de programmes a en effet tendance a pousser les 
compilateurs dans leurs derniers retranchements, meme si celui que je vous ai propose est relativement 
simple. Si cela vous interesse, j'ai quelques autres programmes du meme style (en fait, il font partie du 
meme concours), dont certains sont nettement plus tordus ! Le seul probleme est que je ne les ai que sur 
papier, et leur saisie est plus que fastidieuse; de plus, rien ne dit que ORCA/C les digerera. J'essaierai 
neanmoins d'en mettre un de temps a autre dans GS Infos. 

Pour ceux qui n'etaient pas avec nous I'annee derniere, et aussi pour ceux qui ont deja oublie mon 
precedent article, je vous rappelle que celui-ci decrivait les tableaux et les pointeurs du C, en insistant sur 
le fait que ces 2 concepts presentent des equivalences. Dans cet article, nous allons continuer notre etude des 
pointeurs, et aborder des mecanismes plus sophistiquSs. 

Tableaux de pointeurs et pointeurs de tableaux 



Nous savons maintenant qu'un pointeur designe I'adresse d'une zone memoire, et que cette derniere peut 
avoir ete declaree comme un tableau. 

Nous avons aussi vu comment, grace a I'arithmetique sur les pointeurs, acceder aux differents elements 
d'un tableau. 

Dans la discussion du precedent article, je m'etais toutefois cantonne a des tableaux a une dimension. 
Voyons maintenant ce qui se passe avec un tableau a 2 dimensions (ou plus generalement a N dimensions) ou, 
comme je I'avais ecrit un tableau de tableaux. 

Soit done un tableau tab[m][n] et un pointeur *pt; je peux alors utiliser I'expression pt = &tab[i][j] 
pour pointer sur un element donne du tableau, de la meme maniere que j'ecris par exemple p = &t[k] pour 
pointer sur un element quelconque d'un tableau a 1 dimension, x = *pt me permet alors d'acceder a 
l'el§ment d'indices i et j dans I'exemple precedent. Si j'ecris pt = tab, alors *pt donne le premier element 
du tableau, soit tab[0][0]. Jusque la, rien de bien nouveau. 

En revanche, comme tab est un tableau de tableaux, tab[i] (avec un seul indice) donne I'adresse de debut 
du ieme sous-tableau. S'agissant d'une adresse, je peux affecter cette valeur a un pointeur. Je peux done 
ecrire pt = tab[i]; pour acceder aux elements definis par la seconde dimension, je peux ensuite utiliser mon 
pointeur comme tableau a une dimension et done ecrire pt[j], ce qui revient alors exactement au meme que 
tab[i][j]. 



^J 
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Vous me direz que tout cela prete facilement a confusion, car on peut s'y perdre rapidement. Malgre tout, 
il y a un avantage enorme a cette ecriture : comme les tableaux sont en general manipules dans des boucles, 
et dans le cas d'un tableau a plusieurs dimensions, dans des boucles imbriquees, I'ecriture pt[j] simplifie le 
calcul des adresses des elements j, et done ameliore la performance, puisque le calcul de I'adresse du ieme 
sous-tableau tab[i] est faite en dehors de la boucle interne. Sachez neanmoins que la plupart des 
compilateurs modernes (dont ORCA/C dans sa version 2.0) effectuent ce genre d'optimisation eux-memes, 
et que Ton peut s'en passer si Ton ne la trouve pas claire (cela fait partie ce que Ton designe sous le nom 
d'elimination des invariants). 

Lorsqu'on fait reference a un tableau declare par ailleurs, je vous avais dit dans le precedent article qu'il 
n'etait pas necessaire d'indiquer la taille des premieres dimensions; ainsi, on peut par exemple declarer un 
tableau comme parametre formel d'une fonction comme tab[][n]. Mais, puisque la premiere dimension 
correspond a un tableau de tableaux, e'est a dire a I'adresse de chacun des sous-tableaux, je peux definir ce 
parametre comme etant un pointeur sur un tableau, soit (*tab)[n]. Les parentheses sont importantes, car 
les crochets "[]" ont une precedence superieure a I'operateur de dereferencement "*". La syntaxe *tab[n] 
correspond done a un tableau de pointeurs, et nous verrons son utilisation un peu plus loin. 

L'utilisation des pointeurs a tendance a compliquer un peu les declarations, en obligeant souvent a mettre 
des tas de parentheses un peu partout de fagon a prendre en compte la precedence des differents operateurs 
impliques. En fait, il faut voir la declaration d'une variable en C comme un modele de l'utilisation de cette 
variable, e'est a dire que si j'utilise exactement la meme syntaxe dans une declaration et dans une 
expression, j'obtiendrai un objet du type declare. Dans notre exemple precedent, en declarant (*tab)[n] un 
pointeur sur un tableau de n elements, j'accederai a chacun de ces elements par un acces a (*tab)[i], ce qui 
signifie dereferencer le pointeur sur le tableau, ce qui donne bien le tableau en question, puis acceder a 
I'element i de ce tableau. 

II me suffira done de faire varier le pointeur (*tab) dans I'expression precedente, par exemple en 
utilisant I'arithmetique sur les pointeurs, pour acceder a chacun des sous-tableaux. Cependant, cette 
ecriture est un peu lourde et l'utilisation d'un tableau a plusieurs dimensions sous cette forme n'apporte 
pas grand chose par rapport a la syntaxe complete tab[m][n]. 

Tableaux de pointeurs 



Par ailleurs, je vous avais dit dans le precedent article que Ton n'avait pas le droit d'ecrire tab[m][] 
puisque I'on n'etait alors pas capable de calculer les adresses de chacun des elements. En revanche, comme 
tab[i] est un pointeur sur des sous-tableaux, je pourrai a la place dire que mon tableau a 2 dimensions est 
un tableau de pointeurs, e'est a dire ecrire *tab[m]. 

Cette forme est beaucoup plus interessante que celle decrite dans la section precedente, puisqu'elle permet 
par exemple d'avoir des sous tableaux de taille differente, alors que l'utilisation d'un tableau a 2 dimensions 
definit obligatoirement un rectangle dans lequel chaque ligne et chaque colonne a le meme nombre 
d'elements. 

Les pointeurs de chaque element de ce tableau correspondent a une zone memoire contigue qui aura ete en 
general allouee dynamiquement, mais qui peut s'utiliser comme un tableau, grace a I'interchangeabilite des 
2 concepts. 

Par consequent, je peux continuer a acceder a chacun des elements des zones pointees comme s'il s'agissait 
d'un tableau a 2 dimensions, soit tab[i][j]. 

II y a quand meme une difference : si j'ai declare par exemple un tableau de 10 lignes et de 10 colonnes 
d'entiers, j'ai reserve quelque part en memoire 100 entiers soit 200 octets contigus et le compilateur C 
fera tous les calculs d'adresse necessaires a I'acces de chacun des elements lorsque j'utiliserai tab[i][j]. En 
revanche, si le tableau a ete declare comme un tableau de 10 pointeurs sur des entiers *tab[10], le 
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compilateur C ne reservera la place necessaire qu'aux 10 pointeurs, soit 40 octets. II sera de ma 
responsabilite de programmeur d'allouer la memoire aux 10 tableaux de 10 entiers et d'initialiser les 
pointeurs avec les adresses de ces 10 tableaux; au final, j'aurai toujours bien les 100 entiers desires (et 
les 200 octets qu'ils occupent), mais ils ne seront pas forcement contigus (cela dependra de la fagon dont 
fonctionne I'allocateur de memoire); de plus, cette solution occupera 40 octets supplementaires a la 
precedente. II est clair que cet exemple (avec un tableau de cette taille) ne demontre pas reellement I'utilite 
d'une telle approche. 

Elle a toutefois plusieurs avantages : meme si Ton accede a chaque element par un tableau a 2 dimensions, 
cet acces se fera par un dereferencement de pointeur et non par une multiplication pour chaque calcul 
d'adresse, ce qui est nettement plus performant; ensuite, comme je I'ai dit plus haut, chacun des sous 
tableaux n'a pas besoin d'avoir la meme tailie que les autres, ce qui permet de n'utiliser que la memoire 
strictement necessaire a une execution de mon application plutot que de reserver systematiquement d'avance 
une grande quantite de memoire en provision d'un cas particulier; de plus, je peux demarrer avec des 
tableaux de petite taille et les redimensionner seion les besoins, ce qui implique que je n'ai pas besoin de 
connaitre la taille de mes tableaux lors de I'ecriture de mon programme. 

Pour se compliquer la vie, on peut aussi definir un pointeur sur un tableau de pointeurs, ce qui s'ecrirait 
*(*tab)[n]. Ainsi, meme le premier tableau peut etre alloue dynamiquement lors de I'execution du 
programme. On pourra neanmoins preferer la syntaxe **tab pour parvenir au meme resultat, puisqu'au 
fond, on ne s'interesse pas tenement a la taille maximale "n". 

Tableaux de chaines de caracteres 



— 



Cette utilisation de tableaux de pointeurs trouve tout son sens avec les chaines de caracteres. En effet, en 
C, il n'y a pas de notion de chaines de caracteres, mais plutot celle de tableaux de caracteres. Un tableau de 
caracteres est aussi, de part I'equivalence entre pointeurs et tableaux, un pointeur sur le premier 
caractere de la chaine. En particulier, une chaine constante telle que "Ceci est une chaine" est en fait un 
pointeur sur le premier caractere de cette chaine. Par consequent, on peut affecter une telle chaine a un 
pointeur, comme char *str = "Ceci est une chaine"; il faut bien comprendre que la chaine n'est pas 
recopiee, mais simplement que le pointeur sur cette chaine est affecte a la variable "str" qui pointe done 
aussi sur la chaine en question. 

C ne dispose d'aucun operateur pour manipuler des chaines de caracteres, et il faut recourir a des 
fonctions de la librairie pour les traiter; celle-ci est assez riche et il est tres facile de la completer grace 
aux operations que Ton peut effectuer avec les pointeurs. La plupart des fonctions fournies en standard 
peuvent d'ailleurs etre ecrites en C de fagon tres simple (en fait elles le sont dans la plupart des 
implementations); nous avons vu dans le precedent article la fonction strlen(); pour vous donner un autre 
exemple, voici les fonctions strcpy() et strcmpQ : 

void strcpy ( char *s1, char* s2 ) /* copie s2 dans s1 */ 

{ 

while ( *s1++ = *s2++ ); 

} 

short stremp ( char *s1, char *s2 ) f* retourne si s1 == s2, < si < et > 

si > */ 

{ 

for ( ; *s1 == *s2; s1++, s2++ ) 

if ( *s1 == '\0' ) 

return ( ); 

return ( *s - *t ): 

} 
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Vous constatez encore une fois la concision du langage C, notamment dans la fonction strcpy() : on copie 
chacun des caracteres de s2 dans si en utilisant la post-incrementation pour acceder a chacun des 
caracteres, le fait que les parametres sont passes par valeur pour pouvoir les modifier sans risques, ainsi 
que le fait qu'une comparaison se fait toujours implicitement par rapport a 0; on beneficie alors du 
principe que toutes les chaines C sont terminees par \0' (c'est a dire 0) pour terminer la boucle, une fois 
que le en question a ete recopie. La fonction strcmp() utilise les memes principes et utilise en plus 
I'ordre du code ASCII pour indiquer si les 2 chaines sont identiques ou laquelle est inferieure a I'autre des 
qu'elles divergent. 

Bien entendu, si cette ecriture vous perturbe, vous pouvez expliciter chacune des operations, et exploiter 
Equivalence entre les pointeurs et les tableaux. 
Par exemple, la fonction strcpy() peut aussi etre programmee de la fagon suivante : 

void strcpy ( char *s1, char* s2 ) /* copie s2 dans s1 */ 

{ 

short i; 

for ( I = 0; s2[i] != '\0'; i++ ) 
s1[i] = s2[i]; 
81 [I] = '\0'; 
} 

Cette forme est peut-etre plus claire, encore qu'une fois qu'on est habitue a C, ce ne soit pas si sur, mais 
elle est en tout cas nettement moins efficace. 

La notion de tableaux de pointeurs est done tres interessante lorsqu'on les pointeurs en question 
correspondent a des chaines de caracteres. Un tel tableau est defini par : 

char *tab[n]; 

Chaque element d'un tel tableau est alors un pointeur sur des caracteres, autrement dit une chaine de 
caracteres. II est bien evident que dans ce cas, chacun des tableaux pointe a une longueur differente, ce qui 
prouve, si besoin etait, Pinteret de cette notion. 



^ 



Ce tableau peut etre initialise comme tout autre tableau, par exemple : 

char *jours[] = { "Lundi", "Mardi", "Mercredi", "Jeudi", "Vendredi", "Samedl", 
"Dimanche" }; 

Comme d'habitude, le compilateur calculera la taille de ce tableau, en I'occurence, il allouera un tableau 
de 7 pointeurs, chacun d'entre eux pointant sur I'une des constantes chaines de caracteres correspondant a 
I'un des jours de la semaine. Si je veux afficher le nom du jour correspondant a un jour donne, je pourrai 
alors ecrire I'instruction : 

printf ( "Jour = %s\n", jours[j] ); 

j donnant le numero du jour desire\ 

Comme un tableau est aussi une adresse a laquelle je peux associer un pointeur, je peux afficher dans 
I'exemple precedent tous les jours de la semaine ainsi : 
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char **j; 

for ( j = jours; j < jours + 7; j++ ) 
printf ( "Jour = %s\n", *j ); 

Dans cet exemple "j" est un pointeur sur un pointeur sur un caractere, ou, dit autrement, un pointeur 
sur une chaine de caracteres; je peux done faire parcourir le tableau en incremental "j" et en m'assurant 
que je ne deborde pas de ce tableau, I'affichage des chaines se faisant lui en dereferengant le pointeur "j". 

Je ne sais pas si vous vous en rappelez, mais dans le premier article de cette initiation, je vous avais 
presents un programme affichant ses arguments, appele "echoc". Je vous le redonne ici au cas ou vous ne 
vous en souviendriez plus : 

void main ( int argc, char argv[][] ) 

{ 

Int i; 

for ( i = 1; i < argc; i++ ) { 
printf ( argv[i] ); 
if ( i < argc - 1 ) 

printf ( ■ ■ ); 
else 

printf ( "\n" ); 
} 
} 

Ce programme declarait "argv" comme 6tant un tableau de tableaux de caracteres. Avec nos connaissances 
fraichement acquises, nous pouvons maintenant reecrire ce programme en utilisant des pointeurs : 

void main ( int argc, char "argv ) 

{ 

while ( -argc > ) 

printf ( "%s%c", *++argv, ( argc > 1 ) ? ' ' : '\n' ); 
} 

ce qui, encore une fois, est beaucoup plus concis done plus efficace. De plus, je ne trouve pas que cette 
forme nuise a la lisibilite du programme. 



Pointeurs et structures 



*J 



Les pointeurs peuvent bien entendu etre utilises avec les structures; e'est meme la qu'ils expriment toute 
leur puissance. 

Comme pour toute autre variable de n'importe quel type, on peut prendre I'adresse d'une variable de type 
"struct" (ou "union") par I'operateur "&" et affecter cette adresse a une variable de type pointeur sur 
cette structure. 

Ainsi si j'ai declare" : 

struct { 
} s, *p; 
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je peux 6crire p = &s; 

Pour acceder a la structure et a chacun de ses membres, je vais utiliser les 2 operateurs unaires "*" de 
dereferencement et "." d'acces aux membres, soit : 

(*p).membre 

Vous noterez que j'ai du encadrer le dereferencement du pointeur par des parentheses, car il se trouve que 
I'operateur "." a une precedence superieure a celle de "*". Je dois avouer que cette syntaxe est plutot 
lourde, et que i'on peut se demander ce qui a pousse les concepteurs du langage a definir des regies de 
priorite imposant une telle construction. 

Heureusement, ils ont eux aussi estime que Ton pouvait mieux faire, et ont defini un operateur specifique, 
demontrant ainsi la relation tres forte qu'il y a en C entre les pointeurs et les structures; vous ne verrez en 
effet aucun programme C concret qui n'utilise pas cette construction. Cet operateur est represents par le 
symbole "->" montrant ainsi la relation du pointeur pointant sur le membre de la structure. L'expression 
precedente s'ecrit alors : 



p->membre 



Cet operateur a une associativite gauche droite, ce qui implique que si une structure comporte un pointeur 
sur une autre structure, je peux accSder a un des membres de cette deuxieme structure en suivant les liens, 
par exemple p->q->membre. Cette syntaxe montre bien le chemin que Ton doit suivre pour obtenir 
I'information recherch£e. 

Cet operateur "->", de meme que I'operateur "." auquel il correspond directement, a une priorite tres 
elevee, si bien qu'une expression de type ++p->membre sera interpr6tee comme ++(p->membre), c'est a 
dire que c'est le membre qui sera increments et non le pointeur. Si p est en fait un pointeur a I'interieur 
d'un tableau de structures, et qu'on veuille le faire pointer sur la structure suivante du tableau, il faudra 
explicitement I'isoler par des parentheses, par exemple (++p)->membre, qui a pour effet d'incrementer p 
avant d'avoir accede au membre, tandis que (p++)->membre incrSmentera p apres y avoir accede. Notez 
d'ailleurs que dans ce dernier cas les parentheses sont inutiles, c'est a dire que l'expression p++->membre 
est correcte par rapport au resultat desire, car il n'y a pas d'ambigulte sur la variable a incrementer; si 
j'avais voulu incrementer le membre, j'aurais du ecrire p->membre++. Comme le cas de 
post-incrementation d'un pointeur est plus frequent que celui de la pre-incrementation, on s'apergoit qu'en 
general, il n'y a pas trop besoin de rajouter des parentheses un peu partout. 

De la meme maniere, I'operateur "->" a une priorite plus Elevee que celle de I'operateur de 
dereferencement "*", c'est a dire que dans l'expression *p->membre, on accedera a la valeur pointee par 
le membre, lui meme accede en dereferengant p. En combinant ces differents operateurs, on ecrira *p->q++ 
pour incrementer le pointeur q apres I'avoir dereference, (*p->q)++ pour incrementer I'objet pointe par 
q et *p++->q pour incrementer p apres avoir accede a I'objet pointe par q. 

Bien entendu, tout ce que je viens de dire s'applique indifferemment aux structures et aux unions. 

Auto-references 



Un des aspects les plus importants de I'utilisation des pointeurs avec les structures concerne la 
possibility pour une structure de se referencer elle-meme, comme par exemple dans la definition suivante : 

struct s { 

struct s *next; 

} 'head; 
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Bien evidemment, cette auto-reference ne peut se faire qu'au travers d'un pointeur; autrement la 
structure s'incluerait elle-meme a I'infini, ce qu'interdit le compilateur (et le bon sens). En revanche, 
dans la definition precedente, la structure comporte un membre qui est un pointeur vers une autre 
structure du meme type. Ce type de definition permet de realiser ce que Ton appelle des structures 
chamees; je ne detaillerai pas leur utilisation, et je vous renvoie a ma serie sur la programmation qui en 
donne des exemples quasiment a chaque article. 

Ceci etant dit, sachez que ce type de declaration est tondamental, car il est a la base de la majorite des 
programmes concrets en C. On accede a chacun desmembres de la maniere que Ton a vue precedemment, y 
compris pour le membre "next", par exemple, avec les declarations precedentes, head->next donne un 
nouveau pointeur sur un objet du type de la structure. Si j'ai aussi declare" un pointeur "p" sur cette 
structure, je peux parcourir I'ensemble des objets de ce type chaines entre eux par une construction telle 
que : 

for ( p r head; p != NULL; p = p->next ){...} 

Le pointeur "head" est utilise pour pointer sur le premier element de la serie, tandis que le pointeur 
"next" du dernier contient NULL par convention, ce qui permet de determiner quand on a atteint la fin de la 
se>ie; "p" pointe alors tour a tour sur chacun des objets constituant la serie. 

En general, on combine ce type de definition avec la directive "typedef" de fagon a ameliorer la lisibilite 
du programme. On peut done ecrire I'exemple precedent sous la forme : 

typedef struct s { 

struct s *next; 

} *NODE; 

ce qui definit un nouveau type "NODE" comme etant un pointeur sur la structure chainee. Cependant, le 
pointeur vers le noeud suivant doit utiliser la declaration complete (struct s) car NODE n'est pas encore 
defini. Dans ce cas precis, il est possible de faire une reference en avant, et done de declarer la structure 
sous cette forme : 

typedef struct s *NODE; 
struct s { 

NODE next; 

}; 

Table de precedence des operateurs complete 



Maintenant que nous avons vu I'ensemble des operateurs du langage C, je peux vous presenter a nouveau la 
table des priorites de ces operateurs, dont je vous avais fourni une version reduite dans la troisieme partie 
de cette initiation : 



w> 
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Operateur Associativite 

() [] -> . gauche-droite 

!-++-- -unaire +unaire (type) * & sizeof droite-gauche 

* / % gauche-droite 

+ - gauche-droite 

«» gauche-droite 

<<=>>= gauche-droite 

== != gauche-droite 

& gauche-droite 

A gauche-droite 

| gauche-droite 

&& gauche-droite 

|| gauche-droite 

?: droite-gauche 

= += -= *= /= %= «= »= &= A = |= droite-gauche 

gauche-droite 

Je vous rappelle que la colonne associativite" indique dans quel ordre sont evalues ces operateurs, c'est a 
dire de gauche a droite dans la plupart des cas, et parfois de droite a gauche, notamment pour les operateurs 
unaires. 

Cette table est dans I'ordre des precedences decroissantes, c'est a dire que les premiers operateurs cites 
sont ceux ayant la plus forte priorite. 



Allocation dynamique de memoire 



Jusqu'a present, toutes les definitions d'objets que nous avons vu, que ce soit des variables simples, des 
structures, des tableaux ou des pointeurs, correspondent en fait a des zones memoire allouees par le 
compilateur de fagon statique en fonction de la taille de ces objets; le programmeur se contente alors de 
donner un nom et une taille a chacun de ces objets en fonction de ses besoins. 

Dans la vie reelle, il est tres frequent que Ton ne sache pas a priori la taille des donnees que Ton va 
manipuler dans un programme. On a alors 2 possibilites : dans la premiere, on prevoit une taille maximale 
et on dimensionne ses tableaux a cette taille; si la quantite des donnees a traiter est inferieure a cette taille, 
c'est tant mieux, sauf que Ton gaspille eventuellement de la memoire, si on a prevu trop large par rapport a 
ce que Ton sera amene a traiter. En revanche, si Ton a prevu trop juste, le programme devra indiquer a 
I'utilisateur qu'il ne peut traiter le jeu de donnees fourni; si Ton dispose du source du programme, on peut 
eventuellement augmenter la taille de ses tableaux pour permettre le traitement des donnees desire; dans le 
cas contraire, ii faut se retourner vers le fournisseur du programme, et esperer qu'il veuille bien 
satisfaire la demande. Les anciens langages (tels que Fortran, Cobol ou Basic) n'offrent pas d'autre 
possibility directement; il est parfois possible d'utiliser certains services du systeme d'exploitation mais 
ce n'est pas toujours evident lorsque le langage ne vous aide pas. 

La deuxieme possibility est offerte par des langages plus recents tels que Pascal ou C : le programme 
s'alloue la memoire en fonction de ces besoins, et ce au fur et a mesure; ainsi, il n'y a pas de gaspillage 
inutile, et la seule limite imposee est celle de la memoire disponible. En revanche, ce type de programme est 
un peu plus complexe a realiser et a mettre au point que celui utilisant des tableaux pre-dimensionnes, car 
il va faire generalement appel a des structures chainees telles que nous venons de les voir. II peut aussi 
s'allouer des tableaux d'une taille suffisante en fonction des donnees fournies, et les utiliser comme tels, 
cela ne posant aucun probleme en C. 
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[.'allocation dynamique de memoire, puisque c'est comme cela qu'on appelle ce principe, est realisee de 
fagon differente selon les langages. Pascal, par exemple, dispose de I'operateur NEW pour le mettre en 
ceuvre; on lui donne Pobjet que Ton veut materialises et il se debrouille pour allouer la memoire 
necessaire pour le stocker, notamment en prenant en compte sa taille. D'un autre cote, de par son 
fonctionnement, NEW ne peut allouer qu'un seul objet a la fois, et il est impossible d'envisager de I'utiliser 
pour allouer une zone memoire quelconque que Ton va utiliser ensuite comme un tableau (Pascal permet 
d'allouer un tableau dynamiquement, mais comme on doit preciser sa taille au compilateur et meme definir 
ce tableau completement, on retombe sur le probleme du depart). 

C, qui, comme je I'ai deja dit, est un langage de plus bas niveau, ne fournit aucune primitive pour realiser 
I'allocation dynamique de memoire. De la meme maniere qu'avec les autres operations 'avancees', on doit 
recourir a la librairie fournie avec le compilateur pour effectuer une telle allocation. Cette librairie 
fournit 2 fonctions d'allocation de memoire : "malloc" et "calloc". 

La fonction "malloc" admet un parametre qui est la taille de la zone memoire a allouer; il est de la 
responsabilite du programmeur de specifier une taille suffisante pour stocker I'objet qu'il souhaite 
materialises si ce n'est pas le cas, I'initialisation de I'objet pourra aller ecraser la memoire adjacente, 
avec toutes les consequences que cela implique (c'est notamment souvent le cas avec les chaines de 
caracteres, car on oublie frequemment de tenir compte du '\0' final). 

Heureusement, C dispose de operateur "sizeof" (dont nous avons deja parle), evalue lors de la 
compilation, qui permet d'obtenir la taille d'une variable ou d'un type. La fonction "malloc" sera done 
generalement employee dans une construction telle que : 

ptr = (type *) malloc ( sizeof ( type ) ) 

"malloc" retourne un pointeur sur le premier octet de la zone allouee. Comme cette fonction va etre 
utilisee pour allouer de la memoire pour des types d'objets divers et varies, elle retourne un pointeur 
generique (c'est a dire void *). Par consequent, avant de pouvoir affecter son resultat a la variable qui 
pointera sur la zone allouee, il faut faire un cast explicite sur le type du pointeur. 

Si le systeme ne peut fournir la quantite de memoire demandee, "malloc" retournera NULL; il est done de 
bon gout de tester la valeur retournee et d'effectuer un traitement approprie a ce cas, par exemple 
d'indiquer a I'utilisateur que ses donnees ne peuvent etre chargees faute de memoire suffisante. 

La taille fournie a malloc est sur 32 bits, ce qui permet theoriquement d'allouer jusqu'a 4 giga-octets, 
bien plus que ce que vous aurez jamais besoin. En tout cas, vous pouvez allouer plus de 64 kilo-octets d'un 
seul tenant sans probleme, et parcourir cette zone avec un pointeur, meme en utilisant le modele de 
memoire dit petit (voyez votre manuel ORCA/C pour comprendre ce dont il s'agit), avec quelques 
restrictions toutefois, mais qui sont levees dans la version 2.0 du compilateur. 

Notez que c'est le cas sur toutes les machines (du moins toutes celles que je connais) sauf sur PC ou vous 
avez 2 fonctions d'allocation de memoire, une si vous voulez allouer moins de 64 Ko, et une pour des tailles 
plus grandes; ceci est du a I'architecture segmentee des processeurs Intel x86 (et au bricolage qu'est 
MS-DOS), par opposition a ('architecture lineaire du 65816 ou des Motorola 680x0. Et encore, ce n'est pas 
le pire, car vous devez indiquer si vos pointeurs pointent dans les 64 Ko courants ou pas avec des mots clefs 
speciaux, totalement non portables, et sources de plantages divers et varies, sans parler des problemes de 
compatibility. 

La fonction "calloc" a aussi pour but d'allouer de la memoire. Elle presente 2 differences par rapport a la 
fonction "malloc". D'abord, elle admet 2 parametres, au lieu d'un seul : le premier indique le nombre 
d'eMements a allouer tandis que le second donne la taille de chaque element. Si par exemple, vous souhaitez 
allouer un tableau de N entiers, au lieu d'ecrire : 
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tab = (short *) malloc ( n * sizeof ( short ) ); 

vous ecrirez : 

tab = (short *) calloc ( n, sizeof ( short ) ); 

C'est vrai que cela ne change pas grand chose. La seconde difference est plus importante : la zone memoire 
allouee par "calloc" est initialised a alors que celle allouee par "malloc" contient n'importe quoi (en fait 
ce qu'il y avait a cet endroit avant relocation). 

Selon les besoins, on utilisera I'une ou I'autre des fonctions; il est bien evident que I'initialisation d'une 
zone memoire a peut etre penalisante si cette zone a une taille consSquente et que cette initialisation n'est 
pas absolument necessaire au bon fonctionnement du programme. Dans le cas contraire, on peut supposer 
que I'initialisation effectuee par "calloc" sera plus performante que celle que Ton devrait faire par 
soi-meme; ceci est particulierement utile avec les structures et il n'est done pas rare de voir des 
constructions du style : 

p = (struct s *) calloc ( 1, sizeof ( struct s ) ); 

c'est a dire ('allocation d'un seul 6l6ment d'un type structure donne, simplement pour I'avoir initialise a 
0. 

Une fois qu'un pointeur a ete initialise avec I'adresse d'une zone memoire allouee dynamiquement, il 
s'utilise exactement de la meme maniere qu'un pointeur initialise avec une variable statique. On peut alors 
utiliser toutes les possibility que je vous ai presentees dans cet article et le precedent, notamment 
exploiter I'equivalence existant entre les pointeurs et les tableaux, ou bien les structures chamees. 

Par exemple, dans le cas d'un tableau, vous pourriez ecrire : 

tab = (short *) malloc ( 1000 ); 

ce qui alloue un tableau de 500 entiers de 16 bits. Vous pourriez I'utiliser ensuite comme un tableau 
"tab[i]" ou comme une zone pointee "*p++". 

Lorsqu'on n'a plus besoin de cette memoire allouee dynamiquement, il faut la liberer; la librairie C 
fournit pour cela la fonction "free". Celle-ci accepte un parametre qui est un pointeur sur une zone 
memoire allouee precedemment. 

II est extremement important de noter que ce pointeur doit correspondre a une adresse retournee par 
"malloc" ou "calloc" a I'exclusion de toute autre adresse, sinon vous allez droit au devant de nombreux 
problemes, dont potentiellement le crash. Bien evidemment, cela signifie que Ton ne peut pas liberer un 
pointeur correspondant a une variable statique. Mais le type de probleme auquel on peut etre expose se 
produit lorsqu'on a fait varier le pointeur retourne par malloc ou calloc, sans preserver cette adresse. Par 
exemple, avec le tableau tab alloue precedemment : 

tab++; 
free ( tab); 

on est a peu pres certain d'avoir des problemes serieux. II est done necessaire de preserver tab, et 
d'utiliser un pointeur independant pour le faire parcourir la zone memoire allouee. 

Vous etes peut-etre en train de vous demander si il est reellement indispensable de liberer la memoire 
qu'on n'utilise plus, et je vous reponds immediatement que OUI. II faut en effet imperativement liberer la 
memoire qui ne devient plus necessaire, essentiellement parce qu'il s'agit d'une ressource limitee, et qu'il 
est done important de la consommer avec parcimonie : il est frustrant pour un utilisateur de voir 
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apparaitre un message lui signalant qu'il n'y a plus assez de memoire pour satisfaire la tache qu'il veut 
effectuer, alors qu'il y a plein de memoire inutilisee a ce moment. Imaginez par exemple que votre 
traitement de textes ne libererait pas la memoire occupee par chaque document; bien que vous ayez ferme 
toutes les fenetres, il arrivera un moment ou ce programme vous signalera qu'il ne peut ouvrir de nouveau 
document faute de memoire; je pense que vous aurez du mal a accepter cette situation. 

Meme avec des systemes d'exploitation plus sophistiques, mettant en ceuvre des mecanismes de memoire 
virtuelle, la liberation de la memoire inutilisee est primordiale; dans le cas contraire, on risque aussi 
d'atteindre la limite autorisee, mais surtout les performances du programme ont tendance a se degrader 
quand la memoire n'est pas utilisee de fagon optimale. 

Ce phSnomene de non liberation de memoire au fur et a mesure que Ton n'en a plus besoin s'appelle 
"fuites de memoire" (en anglais "memory leaks") et c'est fun des problemes les plus classiques des 
programmes C, meme commerciaux. La plupart des logiciels Mac ou PC et meme ceux tournant sous Unix en 
sont d'ailleurs victimes. Ce probleme semble moins important en Pascal, mais je pense que c'est du d'une 
part au fait que I'allocation de memoire en Pascal est tres limitee, et par consequent nettement moins 
utilisee qu'en C; d'autre part, il n'y a quasiment pas de programmes Pascal vraiment consequents, en 
particulier dans les logiciels commerciaux. 

Sachez toutefois que le fait de quitter un programme libere implicitement toute la memoire qu'il a allouee 
au cours de son execution, et que par consequent, la liberation explicite de la memoire est surtout 
importante pour les programmes interactifs, avec lesquels un utilisateur peut travailler pendant des heures 
sans le quitter, tout en changeant plusieurs fois de document de travail. 

La librairie C standard comporte une derniere fonction d'allocation de memoire dynamique : "realloc". 
Cette fonction permet d'agrandir ou de reduire une zone memoire precedemment allouee par "malloc" ou 
"calloc". Elle accepte 2 parametres qui sont I'ancienne valeur du pointeur et la nouvelle taille de la zone. Si 
I'ancienne valeur du pointeur est NULL, "realloc" effectue un "malloc", tandis que si la nouvelle taille est 
0, cette fonction se comporte comme un "free". Lorsque la nouvelle taille demandee est plus grande que la 
taille actuelle, il est possible que Ton ne puisse pas agrandir la zone memoire a I'endroit ou elle est allouee; 
dans ce cas, "realloc" alloue une nouvelle zone memoire, et recopie I'ancienne dans la nouvelle, puis la 
libere. 

Bien entendu, I'ancienne valeur du pointeur ne correspondra alors plus a une zone allouee au programme, 
et il ne faudra done plus I'utiliser; dans la pratique, il n'y a pas de risques, car on emploiera une expression 
telle que p = realloc ( p, nouvellejaille ) et le pointeur correspondra directement a la nouvelle zone. 



Pointeurs et fonctions 



En C, il est possible de declarer un pointeur sur une fonction, c'est a dire dont la valeur est I'adresse de 
I'une des fonctions du programme. Ce pointeur peut ensuite etre manipule comme tout autre pointeur, par 
exemple constituer un element d'un tableau ou d'une structure, ou bien etre passe" en parametre a une autre 
fonction. Cette possibility permet ainsi de developper des bibliotheques de fonctions generiques. Par 
exemple, on peut envisager d'ecrire une fonction de tri d'un tableau; un des parametres de cette fonction 
sera un pointeur sur une fonction de comparaison; la fonction de tri pourrait alors etre generique, et le 
programme qui I'utilise se chargerait de lui fournir une fonction annexe de comparaison tenant compte du 
type des elements du tableau a trier. 

Pour pouvoir affecter I'adresse d'une fonction a un pointeur, cette fonction doit avoir ete declaree au 
prealable, afin que le compilateur sache a quoi il a affaire; ceci etant fait, il suffit d'affecter le nom de la 
fonction au pointeur (sans les parentheses qui sont utilisees pour appeler la fonction, meme si elle n'a pas 
de parametres), de la meme maniere qu'on donne juste le nom d'un tableau pour obtenir son adresse. Ainsi, 
si j'ai declare" void tunc ( ... ) et void (*p)(), I'expression p = func; donne a p I'adresse de la fonction tunc. 
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La syntaxe de declaration du pointeur p semble un peu lourde a priori. 

Encore une fois, il s'agit d'un modele montrant la syntaxe qu'il faudra utiliser pour effectuer un appel 
indirect a cette fonction, ce qui donnera done : (*p)();. Les parentheses sont indispensables sinon p serait 
interprets comme etant une fonction retournant un pointeur sur void, ce qui n'est pas du tout le but 
recherche\ Vous vous apercevrez que I'appel a la fonction est coherent avec la declaration : p est un pointeur 
sur une fonction, *p est la fonction elle-meme, et (*p)() est I'appel a cette fonction, de la meme maniere 
que funcQ appelle la fonction tunc. 

Comme la syntaxe d'appel a une fonction via un pointeur est un peu lourde, la norme ANSI C, et done les 
compilateurs qui la respectent, permet d'utiliser la syntaxe classique d'appel. Ainsi, dans I'exemple 
precedent, je pourrai appeler la fonction pointee par p en ecrivant p() au lieu de (*p)(). 

Personnellement, je prefere employer la syntaxe explicite de dereferencement du pointeur, afin de bien 
voir qu'il s'agit d'un appel indirect, mais e'est juste une affaire de gout. 

La possibility de faire des tables de fonctions et de passer en parametre I'adresse d'une fonction constitue, 
vous vous en doutez, I'un des points les plus forts du langage C, car il permet, comme je I'ai dit un peu plus 
haut de se constituer des bibliotheques de fonctions generiques. C'est aussi ce type de mecanisme qui est une 
des bases des langages orientes objets; on peut mettre en ceuvre ces concepts directement avec le langage C, 
meme si ils sont alors explicites, au lieu d'etre implicites comme avec un veritable langage oriente objets. 
Pour vous donner un exemple concret, les interfaces utilisateurs graphiques des stations Unix, basees sur le 
systeme X Windows sont quasiment toutes ecrites en C, mais elles utilisent des tonnes de pointeurs sur des 
fonctions pour implementer les mecanismes lies aux objets. 

Je vous recommande d'etudier les librairies accompagnant mes articles sur la programmation; elles 
represented differents exemples d'utilisation des pointeurs avec les fonctions, mais aussi illustrent 
I'ensemble des concepts que nous avons etudies dans ces 2 derniers articles. 



Conclusion 



Avec cet article, nous avons termine" I'etude de I'ensemble des concepts du langage C. Toutefois, comme 
vous avez pu le constater a plusieurs reprises, la librairie C standard est indissociable du langage. Nous 
concluerons done cette initiation avec le prochain article en etudiant les differentes fonctions qui la 
composent, notamment au niveau des entrees/sorties. 
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Chapitre 9 



La librairie C 



Toutes les bonnes choses ont une fin : voici done la derniere partie de mon initiation au langage C. J'espere 
que vous avez pu commencer a programmer dans ce langage grace a cette initiation. 

Comme vous avez pu le constater a plusieurs reprises lors de cette initiation, j'ai fait plusieurs fois 
reference a la librairie associee au langage. En effet, un certain nombre d'operations ne sont pas realisees 
par des instructions du langage (e'est le cas par exemple des manipulations de chaines de caracteres ou des 
entrees/sorties), mais par des fonctions presentes dans une librairie qui est fournie avec le compilateur. 

Ces fonctions sont si importantes pour le developpement de programmes en C que les comites de 
normalisation ANSI puis ISO ont defini une librairie minimale devant accompagner chaque compilateur se 
targuant d'implementer le standard C. 

II est bien evident que le but de cette normalisation est de faciliter le portage des programmes d'un 
environnement a un autre. 

On s'apergoit en effet dans la pratique que la difficult^ de portage d'un programme, dans le cas du C, ne 
vient pas tant des differences du langage lui-meme (il est suffisamment complet pour ne pas necessiter 
d'extensions, ou du moins on peut s'en passer si on a Pintention d'ecrire un programme portable), que des 
differences dans les librairies. Si vous regardez le source d'un programme C destine a etre compile dans 
plusieurs environnements, vous decouvrirez une grande quantite de directives de compilation 
conditionnelle, necessities par la prise en compte de librairies C non standards. 

La librairie minimale definie par le C standard est toutefois assez complete (ce qui ne veut pas dire que 
tous les compilateurs C, censes respecter la norme, fournissent une librairie conforme), notamment par 
rapport a ce que Ton peut trouver dans d'autres langages, comme le Pascal par exemple. II suffit de 
comparer les chapitres decrivant les librairies d'ORCA/C et d'ORCA/Pascal pour s'en convaincre, sachant 
que la moitie des routines de cette derniere sont des extensions. 

Les fonctions que Ton trouve dans la librairie C standard sont issues pour la plupart de la tradition, e'est 
a dire de ce que Ton trouvait habituellement dans les librairies C principalement venues du monde Unix, 
sachant qu'il y a un certain nombre de differences entre la version System V de AT&T et la version de 
I'universite de Berkeley dite BSD. Ce sont ces differences qui posent souvent le plus de problemes lors du 
portage, car la plupart des utilitaires du domaine public (que Ton pourrait avoir envie de porter sur le GS 
ou sur une autre plateforme) ont ete developpes dans les universes americaines, sous BSD, qui propose 
une librairie beaucoup plus riche que celle d'AT&T. La librairie C standard est elle plutot basee sur celle de 
System V, plus repandu au moment de la normalisation (a moins qu'AT&T n'ait fait plus de pression !). Le 
comit6 de standardisation a aussi invente plusieurs nouvelles fonctions qui n'existaient pas dans les 
librairies C de I'epoque. 

Mon but n'est pas de vous detainer I'ensemble des fonctions de la librairie fournie avec le compilateur 
ORCA/C (je vous renvoie au manuel pour cela), mais plutot de vous indiquer les domaines couverts par cette 
librairie. II est interessant de noter qu'ORCA/C ne peut pas etre considere comme un compilateur a la norme 
a part entiere puisque sa librairie n'est pas complete. II est vrai que certaines des fonctions manquantes 
sont difficiles a realiser sur le GS, car elles s'appuient sur des services systeme qui n'existent pas. 
D'autres en revanche seraient les bienvenues, comme celles permettant I'internationalisation des 
programmes. 
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Comme je frequente pas mal d'environnements (plusieurs varietes d'Unix, MS-DOS, VAX/VMS), je me 
suis attache a completer la librairie d'ORCA/C par des fonctions utiles que j'ai rencontre dans I'un ou 
I'autre de ces environnements. 

J'en ai profite pour realiser une implementation de certaines fonctions d6finies par la norme et absentes 
de la librairie fournie par ByteWorks. Enfin, lorsque j'ai eu besoin d'une fonction et que je I'ai considere 
§tre suffisamment g£nerale, je I'ai ajoute a I'une de mes librairies, en partant du principe que je pourrais 
en avoir besoin a un autre moment. Je me suis done constitue au cours du temps plusieurs librairies 
complementaires de celle d'ORCA/C. 

Si je vous en parle ici, e'est non seulement pour vous encourager a vous constituer des librairies de 
fonctions que vous reutiliserez dans tous vos programmes, mais aussi parce que j'ai inclus 3 de mes 
librairies sur cette disquette GS Infos. La documentation des fonctions presentes dans ces librairies n'est 
malheureusement constitute que des commentaires en tete de chacune d'entre-elles; la plupart de ces 
fonctions sont cependant triviales a utiliser et leurs noms et leurs parametres doivent suffire a determiner 
leur syntaxe d'appel. J'ai toutefois place sur la disquette des programmes d'exemple illustrant I'essentiel de 
ces fonctions; certains de ces programmes sont des petites commandes shell que vous placerez a I'endroit 
approprte (e'est a dire dans le sous-catalogue "Utilities" du shell ORCA), tandis que les autres sont 
purement des demonstrations. Je detaillerai toutefois un peu plus les fonctions presentes dans ces 
librairies, lorsque je traiterai dans la suite de cet article les domaines auxquels elles s'appliquent. 

Ces librairies sont : 

• St r Lib : comme son nom I'indique, cette librairie off re des fonctions de manipulation de chaines de 
caracteres. Elle comporte plus de 30 fonctions permettant de realiser toutes les operations imaginables sur 
des chaines C, e'est a dire terminees par un 0. 

• Direct : cette librairie permet de travailler avec des directories; elle contient des fonctions de 
recuperation et de changement des prefixes, des fonctions de creation et de suppression de directory, et 
surtout des fonctions de parcours de directory. 

• MiscLib : cette librairie contient un ensemble de fonctions et de macros diverses et varices, qui ne 
trouvaient pas leur place dans les autres librairies. Vous y trouverez notamment des fonctions permettant 
de traiter les options d'une commande, de faire I'expansion d'un nom de fichier comportant les wildcards 
standard du shell ORCA, d'obtenir les attributs d'un fichier, de lire et d'ecrire n'importe ou en memoire, 
d'interroger le clavier, ... 



w 



Un aspect important de I'utilisation de librairies par un programme C, que ce soit les miennes ou la 
librairie standard, ou n'importe quelle autre librairie, est I'interfacage entre votre programme et ces 
librairies. Cette interface est realisee par I'intermediaire d'un fichier "header" identifie par son suffixe 
".h" que Ton inclut au d§but du programme. Dans le cas de la librairie standard, vous trouverez un fichier 
header par domaine d'application. Tous ces fichiers headers sont rassembles dans un repertoire defini par 
I'environnement de developpement que vous utilisez (dans le cas d'ORCA/C, il s'agit de 
.../Libraries/OrcaCDefs); une syntaxe speciale de la directive #include indique au compilateur qu'il doit 
exploiter ces fichiers headers et non ceux presents dans le repertoire du source compile. 

Pour indiquer au compilateur que vous souhaitez utiliser les fichiers header d'interface avec les 
librairies, vous utiliserez la syntaxe #include <header.h> tandis que pour inclure les fichiers header 
propres a votre programme, vous utiliserez la syntaxe #include "header.h". 
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La librairie C standard recouvre plusieurs grands domaines : 

• Des fonctions permettant de rSaliser des entrees/sorties aussi bien avec des fichiers, qu'avec le clavier 
et I'ecran. 

• Un ensemble assez complet, mais enrichissable, de fonctions de manipulation de chaines de caracteres. 

• Des fonctions de classification des caracteres et de conversion entre des nombres et des chaines. 

• Les fonctions math§matiques les plus usuelles ainsi que quelques unes que Ton trouve plus rarement. 

• Des fonctions permettant de controler I'execution du programme ainsi que des fonctions permettant 
d'interagir avec son environnement. 

• Des fonctions d'allocation et de liberation de memoire dynamique. 

• Des fonctions assez completes de manipulation du temps. 

• Des fonctions diverses n'entrant pas dans les categories precedentes. 

Voyons done maintenant un peu plus en detail ce qu'offre la librairie d'ORCA/C dans chacun de ces 
domaines. 

Les entrees/sorties 



Le modele d'entrees/sorties propose par la librairie C est directement inspire de celui d'Unix, e'est a dire 
qu'un fichier est vu comme une sequence continue d'octets, sans aucune structure interne pr§definie. C'est 
done a la charge de chaque application de d£finir le format et la longueur de ses enregistrements. Ce modele 
est adequat pour le GS, puisque c'est aussi de cette maniere que GS/OS traite les fichiers. 

Si vous §tudiez attentivement la documentation, vous decouvrirez qu'il y a 2 ensembles de fonctions 
permettant de lire ou d'ecrire dans un fichier : les premieres sont precedees par la lettre "f" comme "file" 
ou "fichier" et travaillent avec un pointeur sur une structure "TILE" sur laquelle nous allons revenir, 
tandis que le second jeu de fonctions utilise un entier pour identifier le fichier; de plus, le nombre de 
fonctions est beaucoup plus limite. 

L'existence de ces 2 jeux de fonctions est historique : sous Unix, le deuxieme ensemble de fonctions decrit 
ci-dessus ne fait pas partie de la librairie C, mais correspond a des services systeme, et sont done 
Equivalents aux appels que vous pouvez faire a GS/OS; sous Unix, le premier jeu s'appuie sur ces fonctions 
pour fournir des services plus evolues. Comme ces services de bas niveau sont parfois utilises, la plupart 
des librairies C les emule en tant que fonctions de ces librairies. 

En dehors de cet aspect historique, il y a dans la plupart des implementations (c'est notamment le cas sur 
le GS ) une difference importante entre ces 2 jeux de fonctions : les fonctions emulant les services systeme 
d'Unix (ainsi que ces services eux-memes dans le cas d'Unix) effectuent des entrees/sorties non bufferisees 
tandis que les fonctions travaillant sur une structure FILE maintiennent un buffer sur le fichier. 

La structure FILE associe, entre autres, I'adresse du buffer a I'identifiant du fichier (dans le cas du GS, il 
s'agit du num6ro de reference GS/OS) ainsi que la position dans le buffer. 
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Ainsi, lorsque vous demandez a lire par exemple 20 octets, la librairie lit d'office 1024 octets (par 
defaut), puis, lors des lectures suivantes, vous retourne les octets suivants du buffer jusqu'a son 
epuisement, auquel cas elle reeffectue une nouvelle lecture du disque. De la meme maniere, le buffer n'est 
ecrit sur disque que lorsqu'il est plein. La librairie C vous permet de changer la taille de ce buffer, voire 
meme de I'annuler completement, et meme de vider le buffer lorsque vous ecrivez un caractere de fin de 
ligne (en C, c'est le fameux "\n") grace aux fonctions "setvbuf" et "setbuf" (la deuxieme est la forme 
ancienne et est a considerer comme obsolete). Vous pouvez aussi vider le buffer quand vous le souhaitez en 
appelant la fonction "fflush". Bien evidemment le buffer sera aussi vide lors de la fermeture du fichier. 

Les fonctions emulant les services systeme d'Unix effectuent done des entrees/sorties directes, c'est a 
dire que dans le cas du GS, elles se contentent d'appeler GS/OS. Ces fonctions sont peu nombreuses, puisqu'on 
ne trouve que "creat", "open", "read", "write", "Iseek" et "close", ainsi que "fcntl" qui permet de 
controler certains aspects du fichier; la version de la librairie d'ORCA/C ne permet que de dupliquer le 
numero d'identification du fichier (qui n'est pas le numero de reference GS/OS, mais un index dans une 
table interne contenant le numero de reference), et done d'avoir 2 chemins d'acces au meme fichier. Cette 
tache est aussi assuree par la fonction "dup"; les 2 sont pr§sentes uniquement pour assurer la 
compatibility avec des programmes venant d'Unix. Bien §videmment, toutes ces fonctions ne font pas partie 
de la librairie normalisee qui ne definit que le jeu de fonctions d'entrSes/sorties bufferisees, et qui sont 
done appelees 'standard'. 

Les fonctions de la librairie d'entrees/sorties standard ont bien entendu les memes noms que leurs 
consceurs, mais leurs noms sont precedes par un "f" : vous trouverez done un "fopen", un "fread", un 
"fwrite" et un "fclose"; en revanche, il n'y a pas de "fcreat", ceci etant effectue par une option de "fopen" 
(d'ailleurs "creat" appelle aussi "open" avec des options particulieres). 

La librairie permet de distinguer entre des fichiers texte, dans lesquels sont definies des lignes separees 
selon les environnements par un CR et/ou un LF, et des fichiers binaires qui ne contiennent qu'une suite 
d'octets sans signification particuliere (du moins pour la librairie). Vous devrez indiquer quel type de 
fichier vous voulez traiter lors de I'ouverture. Cependant, les fonctions "fread" et "fwrite" lisent une 
suite d'octets sans tenir compte de leur valeur, quelque soit le type du fichier. Lorsque vous lisez ou ecrivez 
un fichier texte, vous utiliserez done plutot les fonctions "fgets" et "fputs" qui s'arretent des qu'elles 
rencontrent un caractere de fin de ligne. 






Vous pouvez aussi utiliser les fonctions "fgetc" et "fputc" qui vous permettent de lire et d'ecrire 
caractere par caractere et done de les traiter au fur et a mesure que ceux-ci sont lus ou ecrits. La librairie 
dispose aussi d'une fonction "ungetc" qui permet de renvoyer le caractere qui vient d'etre lu (en fait on 
peut renvoyer n'importe quel caractere puisqu'on indique lequel) dans le fichier; ceci est utile par exemple 
lorsque vous decodez un fichier caractere par caractere et que vous vous apercevez que vous venez de lire un 
caractere de trop, vous le renvoyez dans le fichier afin que la prochaine lecture vous donne a nouveau ce 
caractere. ORCA/C ne permet de renvoyer qu'un seul caractere. En fait, celui-ci n'est pas reellement 
renvoye, mais est stocke dans un des champs de la structure FILE. 

Histoire de vous compliquer un peu la vie, certaines de ces fonctions (les "fputx" et les "fgetx") existent 
aussi sans le T de tete; ces fonctions appartiennent quand meme a la meme famille, ce sont simplement des 
raccourcis. Dans le cas de "getc" et de "putc", il s'agit de macros tandis que les "fgetc" et "fputc" 
correspondant sont de vraies fonctions; 2 autres macros sont definies dans le fichier header "stdio.h" 
correspondant a toutes ces fonctions : "getchar" et "putchar" permettent de lire et d'ecrire un caractere 
directement au clavier et a I'ecran. Toutefois dans le cas de "getchar", il ne s'agit pas d'une saisie au vol 
puisqu'il faut taper un retour chariot pour terminer la saisie; en fait "getchar" retourne successivement 
chacun des caracteres tapes avant le caractere de fin de ligne. 
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Certaines librairies proposent une fonction "getch" de saisie d'un caractere au vol; cette fonction est 
souvent accompagnSe par la fonction "kbhit" qui permet de savoir si il y a un caractere saisi en attente ou 
non. Vous trouverez une implementation de ces 2 fonctions dans ma librairie "MiscLib". J'ai aussi ecrit les 
fonctions "clrkb" r6initialisant Pelat du clavier, et "getmod" recuperant l'6tat des touches de modification 
(majuscule, commande, option, controle, ...) de fagon a prendre en compte les specifiers du GS. Des 
symboles definis dans "MiscLib.h" sont associSs a chacune des touches de modification. 

Pour "gets" et "puts", il s'agit de fonctions de lecture d'une ligne au clavier et d'ecriture d'une chaine a 
I'ecran; attention : ce ne sont pas des macros indiquant que le fichier est "stdin" ou "stdout", mais de 
veritables fonctions, qui, en plus, ont une semantique ISgerement differentes de leurs consceurs : dans le cas 
de "fgets", le caractere de fin de ligne est place en fin de chaine tandis qu'il ne Test pas avec "gets"; pour 
"fputs", il n'y a pas d'ajout automatiquement de caractere de fin de ligne apres la chaine (sur la base qu'il 
y en a deja un provenant de "fgets"), alors que "puts" lui en envoie un systematiquement. 

Vous pouvez enfin utilisez les fonctions "fscanf" et "fprintf" qui vous permettent de controler ce qui est 
lu ou ecrit, en definissant pr6cisemment le format de chacune des variables que vous souhaitez lire ou 
ecrire dans le fichier. Ces fonctions ont chacune 2 variantes : les fonctions "scant" et "printf" sont 
utilises pour lire au clavier et ecrire sur I'ecran; les fonctions "sprintf" et "sscanf" permettent elles 
d'ecrire le resultat formate dans une chaine de caracteres, et de decoder une chaine dans differentes 
variables. La norme definit aussi pour les fonctions "xprintf" une version acceptant une reference sur une 
liste d'arguments variables; ces fonctions sont identiques aux autres de la famille "printf", elles sont juste 
precedees par un "v" : on a done "vprintf", "vsprintf" et "vfprintf". Ces fonctions etaient absentes de la 
librairie d'ORCA/C vl.x, mais font leur apparition avec ORCA/C v2.0. En attendant, vous en trouverez une 
implementation triviale bien que complete dans ma librairie "MiscLib" (j'ai d'ailleurs ajoute un 
mecanisme de compilation conditionnelle pour ne pas les inclure si vous avez ORCA/C 2.0; toutefois, la 
librairie deja generee sur la disquette les contient). L'interet de ces fonctions est de pouvoir offrir les 
possibilites de formatage de "printf" dans une fonction propre au programme, par exemple une fonction 
d'affichage de message d'erreur ou d'ecriture dans une fenetre via la Toolbox. 

La librairie comporte plusieurs fonctions permettant d'obtenir la position dans le fichier et de se 
repositionner : "rewind", "ftell" et "fseek" sont destinees a §tre utilisees ensemble, de meme que 
"fgetpos" et "fsetpos"; les premieres sont les fonctions originales, tandis que les secondes ont ete inventees 
par la norme. Les macros "terror" et "feof" permettent de savoir si une erreur s'est produite (bien que 
chaque fonction indique si elle s'est deroulee correctement ou pas), et si on a atteint la fin du fichier. La 
macro "clearerr" permet d'annuler I'indicateur d'erreur. 






La librairie contient enfin quelques fonctions annexes telles que "remove" pour supprimer un fichier ou 
"rename" pour le renommer. 

Bien qu'elle soit deja fort riche, plusieurs fonctions utiles manquent a I'appel et surtout existent 
ailleurs, et sont done utilisees dans pas mal de programmes; je les ai done ecrites et ajoutees dans ma 
librairie "MiscLib" : la macro "fileno" permet d'obtenir le numero de reference GS/OS associe a une 
structure FILE. La fonction "access" permet de savoir si un fichier existe ou non; de plus un flag indique si 
Ton veut aussi verifier si on peut lire ou ecrire le fichier en fonction de ses droits d'acces. La fonction 
"fgetname" retourne le nom complet d'un fichier ouvert; ceci est utile si le fichier a ete donne avec un 
chemin partiel. 
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Enfin, les fonctions "stat" et "fstat" permettent de recuperer les attributs d'un fichier; ces 2 fonctions 
sont identiques : la premiere est utilised avec un nom de fichier tandis que la seconde attend une structure 
FILE sur un fichier ouvert. II est a noter que la fonction "fstat" s'utilise en principe avec un numero de 
fichier, bien qu'elle commence par un "f", mais comme les fonctions correspondantes sont marginalement 
utilisees sur le GS, j'ai pr£fer§ faire une legere entorse a la compatibility. Ces 2 fonctions sont basees sur 
la primitive "GetFilelnfo" de GS/OS, et elles reorganised les informations dans une structure C compatible 
avec d'autres implementations de "stat"; de plus, les dates de creation et de modification sont converties 
dans le format de la librairie C. 

Au dela de ces fonctions de manipulation de fichiers, certaines librairies, notamment sous Unix, offrent un 
ensemble de fonctions permettant de travailler avec des directories. Je me suis done attache a developper 
une librairie (appelee "Direct") impiementant toutes les fonctions que I'on peut trouver dans ces 
librairies etrangeres; j'ai essaye d'etre le plus compatible possible avec ces librairies, aussi bien au 
niveau de I'interface (nombre et type des parametres) que de la semantique des fonctions (elles se 
component de la meme maniere et renvoient les memes erreurs). Mon implementation differe parfois de ces 
librairies, soit parce que GS/OS ne permettait pas d'emuler completement la fonction correspondante, soit 
aussi qu'il avait plus a offrir, et j'ai alors exploite les possibility supplementaires. 

La librairie "Direct" comporte 4 categories de fonctions : 

• Des fonctions permettant d'obtenir et de changer le prefixe courant, ainsi que n'importe lequel des 
prefixes ger6s par GS/OS. Ces fonctions sont "getcwd", "getwd" (il s'agit d'une forme obsolete de la 
precedente, qu'il vaut mieux done eviter d'employer) et "getdir_gs" pour la recuperation de la valeur d'un 
prefixe GS/OS; les 2 premieres obtiennent le directory par defaut represents par le prefixe 8 (et/ou 0), 
tandis que la derniere permet de recuperer la valeur de n'importe quel prefixe GS/OS. Les fonctions 
"chdir" et "chdir_gs" permettent elles de changer le directory par defaut (encore une fois, il correspond 
au prefixe 8 et 0) ainsi que n'importe quel autre prefixe, a I'exception des prefixes 10, 11 et 12 reserves 
pour les entrees/sorties standard sur la console. 

• Des fonctions permettant de creer et d'effacer des directories; dans ce dernier cas, le directory doit etre 
vide, e'est a dire que les fichiers qu'il contient doivent etre supprim6s au prealable. Ces fonctions sont 
respectivement "mkdir" et "rmdir". 

• Des fonctions permettant de lire un directory, nom de fichier par nom de fichier. 

Je dirais que ces fonctions sont de bas niveau. La lecture d'un directory est r6alisee par les 3 fonctions 
"opendir", "readdir" et "closedir"; ces fonctions travaillent avec un pointeur sur une structure DIR de la 
meme maniere que leurs equivalentes pour les fichiers utilisaient un pointeur sur une structure FILE. 
Trois fonctions de repositionnement competent cette categorie : "telldir" pour connaitre la position 
actuelle et "seekdir" et "rewinddir" pour se repositionner, la premiere sur une entree retournee par 
"telldir" et la seconde au debut du directory. 

• 2 fonctions de parcours de directory de plus haut niveau, s'appuyant sur les fonctions de la categorie 
precedente. La fonction "scandir" retourne une liste triee (en principe dans I'ordre alphabetique) de tout 
ou partie des noms de fichiers d'un directory; cette fonction accepte comme parametre I'adresse d'une 
routine de selection qui indique en retour si le fichier doit etre mis dans la liste ou pas; il est possible de ne 
pas employer cette possibility et done de selectionner tous les fichiers. On utilisera la fonction "stat" 
d6crite precedemment pour obtenir les attributs de chaque fichier, si on veut les utiliser comme criteres de 
selection. Un autre parametre definit une fonction de comparaison pour le tri; la librairie fournit une 
fonction de comparaison alphabetique ne tenant pas compte des majuscules et des minuscules, si on souhaite 
utiliser ce defaut. Cette fonction, d6nomm6e "alphasort" peut etre utilisee dans d'autres contextes. 
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La fonction "ftw" (pour file-tree-walk) permet de parcourir I'arborescence de directories a partir d'un 
directory donne et sur une certaine profondeur; elle appelle une fonction utilisateur (dont I'adresse 
constitue un des parametres) pour chacun des noms de fichiers trouves. Elle a deja appele la fonction "stat" 
et elle passe les informations correspondantes a la fonction utilisateur, ainsi qu'un flag indiquant si le nom 
correspond a un fichier ou a un directory. 

Toutes ces fonctions de manipulation de directories sont illustrees par les 2 programmes d'exemples 
"dtree" pour "ftw" et "testdir" pour toutes les autres. 



Les chaines de caracteres 



Comme je Pai deja ecrit plusieurs fois, il n'y a pas de type "chaine de caracteres" en C, et par consequent 
aucune instruction ne permet de les manipuler. Toutefois, il est evident qu'un grand nombre de programmes 
est amene a travailler avec de telles donnees. En C, cela se fait au travers d'un ensemble de fonctions de la 
librairie. 

La librairie C comporte 2 categories de fonctions de manipulation de chaines de caracteres : la premiere 
est identifiee par le prefixe "str" et la seconde par le prefixe "mem". Les fonctions dont le nom commence 
par "str" travaillent avec des chaines de caracteres dites C; elles sont caracterisees par une sequence 
d'octets quelconques, et de longueur quelconque aussi, et terminees par un 0. Les fonctions dont le nom 
commence par "mem" travaillent elles sur une sequence d'octets quelconques et de longueur quelconque, 
mais sans terminateur particulier; en I'occurence, la sequence d'octets en question peut contenir des 
n'importe ou. 

Avant de detainer les fonctions de la librairie, il me semble utile d'apporter quelques remarques 
preliminaires sur les chaines C. Elles ont fait couler beaucoup d'encre, notamment de la part des supporters 
d'un veritable type chaine de caracteres, dans lequel est maintenu s6parement la longueur de la chaine, 
comme cela est le cas avec les chaines dites Pascal, pr6cedees par un octet de longueur (ce qui a pour 
inconvenient de limiter la longueur de ces chaines a 255 caracteres), ainsi que les chaines GS/OS qui sont 
elles prec§dees par un mot de 16 bits pour indiquer la longueur. 

En effet, certaines operations aussi triviales que revaluation de la longueur d'une chaine ou la 
concatenation de 2 chaines demandent a parcourir la chaine dans son entier et de compter les caracteres 
jusqu'a ce que Ton rencontre le fameux final, ce qui, bien evidemment, coute assez cher en termes de 
performances. La consequence de ceci est qu'il faut maintenir la longueur de la chaine a cote de cette 
derniere, afin de minimiser ce type d'operation. 

En revanche, cette representation permet de faire toutes sortes de manipulations a I'interieur meme de la 
chaine, sans necessiter de la recopier dans une autre chaine. 

Supposez par exemple que vous vouliez separer tous les mots d'une chaine et que chaque mot forme une 
nouvelle chaine; au lieu de recopier chaque mot dans une nouvelle chaine, vous pouvez remplacer les blancs 
par des et retoumer un pointeur sur le premier caractere de chacun des mots. Je vous conseille d'etudier 
n'importe quel programme C travaillant sur des chaines pour avoir une idee plus precise de tout ce qu'il est 
possible de faire. 

Ceci dit, la facility de manipulation de chaines de caracteres n'est toutefois pas sans risques. Le reproche 
le plus serieux qui est fait aux chaines C est que Ton a aucune idee de la longueur reelle de la chaine, dans le 
sens ou on ne sait pas tres bien si la memoire apres le terminateur appartient a la chaine ou pas. Un des 
bugs classiques des programmes C est justement d'aller ecraser des zones m§moires qui ne leur 
appartiennent pas lors de la manipulation de chaines, d'autant que la librairie ne fait strictement aucun 
controle. 
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Un autre probleme frequent se produit lorsque les chaines ont 6te allouees de fagon dynamique; comme 
n'importe quel caractere de la chaine est le debut d'une nouvelle chaine, sous-chame de la chaine initiale, 
on a tendance a 6crire des fonctions retoumant des pointeurs sur le milieu d'une chaine. Je vous I'ai dit dans 
mon precedent article, il est formellement interdit d'appeler "free" sur un pointeur non retourne par 
"malloc", "calloc" ou "realloc"; malheureusement, il arrive tres frequemment que "free" soit appele 
avec des pointeurs correspondant a des milieux de chaine, et ce y compris dans des programmes 
commerciaux parmi les plus connus. Je vous laisse imaginer les problemes souvent obscurs qui peuvent en 
decouler. La morale de cette histoire est qu'il faut bien faire attention a sauver le pointeur retourne par 
I'une des fonctions d'allocation, quelles que soient les manipulations faites par la suite. II est classique de 
voir des sequences de code C ecrites ainsi : 

str = s = malloc ( longueur ); 

manipulations sur s (du type incrementation du pointeur) 

free ( str ); 

Si vous ecrivez vos programmes C de cette maniere, vous n'aurez jamais de problemes. Dans mon article 
sur le debugging toujours a venir, je vous montrerai une librairie au dessus des routines d'allocation 
permettant de s'assurer qu'on libere bien ce qu'on a alloue. 

Nous pouvons maintenant voir ce que la librairie C offre pour manipuler des chaines de caracteres : 

• Puiqu'on ne connait pas a priori la longueur d'une chaine, il nous faut done une fonction permettant de 
la calculer; ceci est fait grace a la fonction "strlen". 

Comme je I'ai ecrit prec6demment, cette fonction compte les caracteres de la chaine jusqu'au final, et 
retourne cette valeur. II est done habile de sauver ce resultat dans une variable intermediate et 
eventuellement reajuster cette variable si la chaine est modifiee, plutot que de recalculer la longueur de la 
chaine a chaque fois qu'on en a besoin. 

• Plusieurs fonctions permettent de copier une chaine dans une autre : "strcpy" est la fonction de base. 
Elle a une variante appel£e "strncpy" qui permet de ne copier qu'une sous-chaine d'une longueur specifiee 
en parametre; si cette longueur est plus grande que la longueur totale de la chaine, cette fonction est 
strictement identique a sa sceur. Pour etre complet, je dois preciser que cette fonction comporte un piege : si 
on ne copie pas tous les caracteres de la chaine initiale, la chaine r6ceptrice n'aura pas de final apres 
cette fonction; si vous le souhaitez, vous pouvez I'ajouter vous-memes, ce qui donne par exemple : 



V. 



strncpy ( dest, source, n ); 
dest[n] = '\0'; 

Dans le cas ou toute la chaine est copiee, le final sera bien present; notez qu'ORCA/C complete la chaine 
destinatrice par une serie de si elle a rencontrS le final dans la chaine source avant d'avoir copi6 les N 
caracteres, mais cela n'est pas necessairement le cas dans d'autres librairies; vous ne devez pas utiliser ce 
fait (d'ailleurs, ga ne me parait pas tres utile). 

Les fonctions "memepy" et "memmove" fonctionnent sur le meme principe que "strncpy", sauf, comme 
je I'ai ecrit plus haut, qu'elles copient systematiquement les N octets demandes, sans tenir compte de la 
presence eventuelle d'octets a 0. 

Pour toutes les fonctions "xxxepy", les 2 zones memoire correspondant aux chaines de caracteres ne 
doivent pas se recouvrir, sinon le resultat est totalement imprevisible. En revanche, la fonction 
"memmove" est congue specialement pour des zones memoires qui se recouvrent. Supposez par exemple que 
vous vouliez supprimer les 3 premiers caracteres d'une chaine, vous pouvez alors ecrire : 

memmove ( str, str + 3, n + 1 - 3 ); 
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vous etes garantis que le resulat sera correct, meme si la copie est faite dans I'autre sens (memmove ( 
str+3, str, n-2) permet de faire de la place pour 3 caracteres au debut de la chaine). Le +1 permet de 
copier aussi le final. 

II faut bien faire attention avec toutes ces fonctions a ce que la chaine destinatrice soit associee a une zone 
memoire suffisante pour accueillir la chaine initiale, en n'oubliant pas de compter le final. Un bug 
classique se presente sous la forme suivante : 

dest = malloc ( strlen ( source ) ); 
strcpy ( dest, source ); 

Ecrit ainsi, vous avez ecrase un octet apres la zone memoire allou§e. Comme c'est la en general que la 
librairie maintient un pointeur sur la zone allouee suivante ou precedente, vous allez avoir de sacres 
problemes lors d'une prochaine allocation ou liberation de memoire. II vous aurait fallu ecrire : 

dest = malloc ( strlen ( source ) + 1 ); 
strcpy ( dest, source ); 

Comme cette sequence d'instructions est tres frequente, et que d'autres librairies proposent une fonction 
pour la realiser, je I'ai definie dans ma propre librairie "StrLib" en utilisant le meme nom que ces autres 
librairies, a savoir "strdup". J'ai aussi defini la fonction "strndup" correspondant a la fonction 
"strncpy"; dans les 2 cas la memoire necessaire au stockage de la chaine cible est allou6e dynamiquement. 
On trouve parfois ces 2 fonctions sous les noms "strsave" et "strnsave", notamment dans le "K&R"; j'ai 
done defini 2 macros permettant d'utiliser ces synonymes. 

Sous Unix BSD, la fonction "memmove" est connue sous le nom "bcopy"; j'ai defini une macro dans 
"StrLib.h" assurant I'equivalence; elle presente toutefois un petit piege, car ses parametres sont inverses 
par rapport a toutes les autres fonctions de copie. Ce n'est pas trop genant, car cette macro est surtout 
destinee a faciliter le portage, et non a etre utilisee dans de nouveaux programmes. 

Toujours sous Unix BSD, il existe une autre fonction de copie, appelee "swab", ce qui signifie "swap 
bytes"; comme son nom I'indique, les octets sont inverses 2 a 2 dans la chaine cible par rapport a la chaine 
source. Cette fonction est pratique lorsqu'on veut traiter des donnees provenant de machines ayant un ordre 
des octets difterents, comme c'est le cas par exemple du Macintosh. Allez savoir pourquoi, j'ai mis cette 
fonction dans "MiscLib" et non dans "StrLib". 

Les librairies Unix comportent une derniere fonction de copie appelee "memccpy" : cette fonction, dont 
vous trouverez une implementation dans "StrLib" fonctionne de la meme maniere que "memepy", sauf 
qu'elle prend un parametre supplemental qui est un caractere de fin, c'est a dire qu'elle copie la chaine 
source dans la chaine cible jusqu'a rencontrer ce caractere ou apres avoir recopie les N octets demandes. 

Ma librairie comporte une fonction de copie que je n'ai pas vu ailleurs et qui releve plus du gadget, bien 
qu'elle peut avoir son utilite quelquefois : la fonction "strrev" effectue une copie en inversant la chaine de 
caracteres; le premier caractere de la chaine source se retrouvera a la fin de la chaine cible, et ainsi de 
suite. 

• Une chaine peut etre initialised avec un caractere donne grace a la fonction "memset". Par exemple 
pour initialiser une chaine a blanc, vous 6crirez : 

memset ( str, ' ', len ); 
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J'ai complete cette fonction par les fonctions "strset" et "strnset" qui effectuent cette initialisation 
jusqu'a rencontrer un final dans la chaine de depart, qui done avoir deja ete initialised, pour "strset" et 
jusqu'a soit un final, soit jusqu'a ce que N caracteres aient ete initialises, selon la premiere condition qui 
se produit. 

Ces 2 fonctions ont chacune un alias sous la forme d'une macro : "strfill" et "strnfill". 

"StrLib" contient 2 autres fonctions d'initialisation d'une chaine avec un caractere donne jusqu'a 
concurrence d'un certain nombre : "strpad" et "strnpad" permettent de completer une chaine par N 
caracteres (par exemple un espace). La premiere fonction effectue I'initialisation a la fin de la chaine 
originale, tandis que la seconde demarre d'une position donn6e. 

Unix BSD dispose d'une version reduite de la fonction "memset" appeiee "bzero" effectuant la mise a zero 
d'une zone memoire donnee. J'ai toutefois defini une macro realisant I'equivalence entre les 2. 

• La librairie C dispose aussi de fonctions de concatenation de chaines de caracteres : "strcat" et 
"strncat" construites sur le meme principe que les fonctions de copie que nous venons de voir. II est a noter 
que ces fonctions sont assez couteuses, car il leur faut se positionner a la fin de la chaine cible avant de 
copier la chaine source. Si Ton connait la longueur initiale de la chaine cible, il est habile de remplacer 
I'instruction : 

strcat ( dest, source ); 

par 

strcpy ( dest + len, source ); 

car on ne fait qu'une addition entre un pointeur et un entier au lieu d'une lecture octet par octet de la 
chaine. 

Encore une fois, la memoire allouee par la chaine cible (qu'elle soit dynamique ou statique) doit etre 
suffisante pour recevoir la chaine source en plus de la chaine cible deja presente. 

La concatenation de plusieurs chaines etant une operation relativement frequente, j'ai implements une 
fonction "strvcat" qui admet une chaine cible et une liste variable de chaines a concatener terminee par un 
parametre a NULL; un aspect important de cette fonction est que la chaine cible est complement §cras£e, 
e'est a dire que son contenu initial n'est pas consider dans la liste de chaines a concatener. Elle s'utilise de 
la fagon suivante : 

strvcat ( dest, srd, src2, src3, NULL ); 

Notez bien qu'il n'y a pas de limite au nombre de chaines concatenees, hormis celles imposees par la taille 
de la pile affectee au programme. 

• Toujours baties sur le meme principe, les fonctions de comparaison "stremp" et "strnemp" permettent 
de savoir si 2 chaines sont identiques ou si la premiere est 'superieure' ou 'inferieure' a la seconde; la 
relation d'inegalite est bas£e sur I'ordre des caracteres ASCII. Comme pour les autres operations sur les 
chaines, "strnemp" permet de ne comparer que les N premiers caracteres d'une chaine. II existe aussi bien 
entendu une fonction "mememp" ne s'arretant pas sur un quelconque octet a 0. Cette derniere fonction 
s'appelle "bemp" sous Unix BSD; j'ai done defini la macro equivalente. 
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Toutes ces fonctions font la distinction entre majuscules et minuscules. II etait done naturel d'ajouter des 
fonctions ne faisant pas une telle distinction, puisque la librairie standard ne les propose pas. C'est le cas 
grace aux fonctions "striemp" et "strinemp" dont les noms correspondent a leurs homologues sous 
MS-DOS, ainsi que "strcaseemp" et "strncaseemp" qui sont des synonymes pour les fonctions que Ton 
rencontre sous Unix. 

"StrLib" comporte une autre fonction de comparaison de chaines, inspiree par Unix, mais originale : 
"strmatch". Cette fonction permet de comparer une chaine donnee avec un motif, pouvant comporter des 
'wildcards' en anglais ou des 'jokers' en frangais. Les jokers reconnus sont des plus classiques; il s'agit du 
'?' qui correspond a n'importe quel caractere, de I"*' qui correspond a une sequence de a N caracteres de 
la chaine, de '[]' qui permet de d§finir un sous-ensemble de caracteres, eventuellement nSgatif si le 
premier caractere apres le '[' est un '!'; le sous-ensemble peut etre un intervalle si Ton indique les 
caracteres extremes et qu'on les sSpare par un '-'; enfin, tous ces jokers peuvent etre annules si ils sont 
precedes par un 'V. Un exemple valant mieux qu'un long discours, je vous recommande d'executer le 
programme "match" qui vous montre comme tout cela fonctionne. 

• Les fonctions "strchr" et "strpos" permettent de localiser un caractere donne dans une chaine; la 
premiere fonction retoume un pointeur sur la position de ce caractere dans la chaine, tandis que la seconde 
retourne un index entier sur cette meme position. Les fonctions "strrchr" et "strrpos" localisent la 
derniere occurence d'un caractere dans une chaine au lieu de la premiere. La fonction "memchr" recherche 
un octet dans une zone memoire d'une longueur donn6e, sans s'arreter sur un quelconque octet a 0. 

Sous Unix BSD, les fonctions "strchr" et "strrchr" sont connues sous les noms de "index" et de 
"rindex" que j'ai done definies en tant que macros dans "StrLib.h". 
Elles sont en tout point identiques a leurs homologues. 

Les fonctions "strspn", "strcspn'7'strpbrk", "strrpbrk" et "strtok" permettent de trouver un 
caractere de la chaine parmi un ensemble de caracteres. Ces fonctions sont relativement puissantes, car 
elles permettent d'extraire tres facilement des sous-chaines d6limitees par un ensemble de sSparateurs. II 
serait trop long de les detainer ici; je vous renvoie done au manuel pour toutes les explications les 
concernant. 






J'ai d§veloppe" des variantes plus simples de ces fonctions, repondant a des besoins moins sophistiqu§s; 
certaines de mes fonctions sont d'ailleurs directement inspires de ce que j'ai pu trouver ici ou la. Les 
fonctions "strskip" et "strskipblanks" retournent respectivement la position du premier caractere 
different de celui indique pour la premiere fonction, et non blanc (un blanc pouvant etre un espace, une 
tabulation ou une fin de ligne) pour la seconde. Cette derniere fonction a un synonyme via la macro 
"strpblnks". La fonction "strsep" est quasiment identique a "strtok" du moins dans son but; ses 
parametres et sa sSmantique sont cependant difterents. 

La fonction "strstr" permet elle de localiser une sous-chaine dans une chaine. "StrLib" ajoute la 
fonction "strrstr" permettant de trouver la derniere occurence d'une sous-chaine dans une chaine. 

• J'ai 6crit plusieurs fonctions permettant de supprimer les blancs d'une chaine (un blanc 6tant defini 
comme pouvant etre un espace, une tabulation ou une fin de ligne) : "strtrim" supprime les blancs de 
queue; cette fonction est parfois appel§e "strrpblnks" par analogie avec celle dScrite pr6cedemment; j'ai 
done d§fini un alias par I'intermediaire d'une macro, "strcompress" rSduit tous les blancs consecutifs 
d'une chaine a un seul tandis que "strcollapse" supprime tous les blancs d'une chaine. 

• Si vous avez programme" en Basic, vous avez sans doute apprecie les fonctions d'extraction de 
sous-chaines. Qu'a cela ne tienne, voici une version en C des fonctions "strleft", "strmid" et "strright" 
qui extraient respectivement les N premiers caracteres d'une chaine, les N caracteres ) a partir d'une 
position P, et les N demiers caracteres. 
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La fonction "strelement" permet elle d'extraire I'enieme sous-chaine d'une chaine, chacune de ses 
sous-chaines etant separes par le delimiteur donne, qui peut d'ailleurs etre different d'un appel a I'autre. 

Remarque importante : toutes ces fonctions allouent la memoire necessaire au stockage de la sous-chaine 
extraite. Elles ne sont done pas exposees aux problemes d'ecrasement evoque plus haut; en revanche, elles 
presentent des risques de fuite de memoire, car il est de la responsabilite du programmeur les utilisant de 
lib§rer la memoire que les chaines retournees occupent, lorsqu'il n'en a plus besoin. 

• De la meme fagon, si vous avez programme en Pascal, vous avez sans doute utilise les 2 fonctions 
"insert" et "delete". Elles vous manquaient en C; ce ne sera plus le cas grace a "strins" et "strdel". 
L'interface est un peu different de leurs homologues Pascal, puisqu'elles utilisent des pointeurs et non des 
indices pour d6finir la position d'insertion ou de suppression dans la chaine. 

Dans la foulee, j'ai cree les fonctions "strrepl" et "strmrepl" qui remplacent une sous-chaine par une 
autre. La deuxieme fonction remplace toutes les occurences de la sous-chaine, tandis que la premiere ne 
remplace que la premiere occurence. 

De la maniere dont "strmrepl" est implementee, la sous-chalne de remplacement ne doit pas inclure la 
sous-chaine remplacee, sinon la fonction va boucler indefiniment. 

Comme les fonctions precedentes, ces fonctions allouent la memoire necessaire a la chaine resultante de 
I'operation. La chaine initiale n'est elle modifiee en aucune fagon. 

Toutes ces fonctions, ainsi que d'autres decrites plus loin, sont demontr§es par le programme "testlib" 
que je vous recommande d'etudier avant d'utiliser cette librairie. 



Classifications et conversions 
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La librairie C standard definit un ensemble de macros de classification d'un caractere. Ces macros 
commencent toutes par "is" et le nom de la macro indique la categorie a laquelle elle se rapporte. La macro 
retourne un rSsultat booleen pour indiquer si le caractere fait partie ou non de la categorie testee. Je ne vais 
pas vous lister toutes ces macros ici (je vous renvoie au manuel pour cela), mais sachez simplement que ces 
macros permettent de savoir si un caractere est alphabetique ou est un chiffre (dans les differentes bases 
geres par le C), si e'est un caractere de controle, un blanc, ... Des macros dSfinissent des categories plus 
larges ou plus restreintes telles que caractere imprimable ou caractere pouvant etre utilise dans un 
symbole C par exemple. 

Au niveau des conversions, la librairie C permet d'effectuer toutes sortes de conversions, soit entre 
caracteres, soit entre des chaines de caracteres et les nombres binaires qu'elles represented. 

Les conversions d'un caractere sont realisees par des fonctions ou des macros dont le nom debute par "to". 
Nous trouvons done 2 fonctions "tolower" et "toupper" permettant de transformer une lettre en minuscule 
ou en majuscule. Si le caractere passe en parametre n'est pas une lettre, il est retourne inchange. Ces 2 
fonctions existent aussi sous forme des macros "Jolower" et "Joupper" qui sont plus rapides, mais qui ne 
fonctionnent pas si le caractere n'est pas une lettre; d'autres implementations n'ont pas cette restriction, 
mais presentent des effets de bord car I'argument est reference plusieurs fois (I'implementation d'ORCA/C 
est conforme au standard si mes souvenirs sont exacts). 

En revanche, la librairie ne permet pas de faire une conversion d'une chaine de caracteres soit en 
minuscules, soit en majuscules. Comme ce sont des operations assez fr6quentes, je les ai implemente dans 
"StrLib" grace aux fonctions "strupper" et "strlower" (qui ont pour synonymes "strupr" et "strlwr" 
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que Ton rencontre parfois dans certains environnements); ces 2 fonctions font la conversion directement 
sur la chaine originale qui est done remplacee. Pour etre tout a fait complet, j'ai aussi ecrit une fonction 
"strcap" qui met la premiere lettre en majuscule, ainsi que toute lettre suivant un signe de ponctuation ou 
un espace, tandis toutes les autres lettres sont converties en minuscules. 

La macro "toascii" definie par la librairie C permet de forcer le caractere passe en parametre a etre dans 
Pintervalle dit ASCII soit entre et 127; on s'apergoit d'ailleurs que ces fonctions de classification de la 
librairie C ne sont pas "8 bits clean" comme on dit, e'est a dire qu'elles ne reconnaissent pas les caracteres 
etendus des autres langues que I'anglais. La norme a cependant defini toute une autre categorie de fonctions 
permettant de travailler avec des caracteres etendus, et meme tres etendus puisqu'ils sont represents par 
plusieurs octets (en general 2) et non plus un seul, afin de prendre en compte les langues orientates (on 
peut d'ailleurs aussi definir le sens de la lecture de ces chaines, de gauche a droite ou de droite a gauche). 
Malheureusement, ces fonctions ne sont pas implementees dans la librairie d'ORCA/C; certaines d'entre 
elles sont tres complexes, e'est peut etre la raison pour laquelle elles sont absentes. II est amuser de noter 
qu'il y a quand meme une reference a ces caracteres etendus, puisque le type "wcharj", utilise par ces 
fonctions, est defini dans "stddef.h". 

La fonction "toint" convertit un caractere representant un chiffre dans son equivalent binaire. L'aspect 
interessant de cette fonction est que le caractere peut correspondre a un chiffre decimal ou hexadecimal, 
e'est a dire a I'une des lettres 'a' ou 'A' a t ou 'P. 

Les autres fonctions de conversion de la librairie C agissent sur une chaine de caracteres representant un 
nombre et donnent comme resultat la valeur binaire de ce nombre. Les fonctions "atoi", "atol" et "atof" 
convertissent une chaine respectivement en entier sur 16 bits, en entier sur 32 bits et en nombre flottant. 

Ces fonctions sont maintenant remplacees par les fonctions plus sophistiquees "strtod", "strtol" et 
"strtoul" qui retournent respectivement un nombre flottant et un long signe et non signe. En plus de la 
conversion, ces 3 fonctions peuvent retourner un pointeur sur le premier caractere suivant ceux exploites 
pour la conversion. De plus les fonctions de conversion en entier acceptent un parametre indiquant la base 
dans laquelle le nombre inscrit dans la chaine doit etre interprete; cette base peut aller de 2 a 36, elle peut 
aussi prendre la valeur 0, ce qui indique que e'est la chaine elle-meme qui indique la base en utilisant les 
regies du C (si le premier chiffre est 0, le nombre est interprete en octal, si la chaine commence par 0x, 
on fera une conversion en hexadecimal, dans les autres cas, le nombre sera converti dans la base decimale). 

La librairie d'ORCA/C ne dispose pas de fonctions inverses des precedentes, e'est a dire qu'il n'y a pas de 
fonction convertissant un nombre binaire dans sa representation par une chaine de caracteres. Certaines 
librairies ont une fonction "itoa" et d'autres fonctions de conversion pour les nombres flottants. Je n'ai pas 
implements ces fonctions, car on peut realiser simplement ces operations grace a la fonction de formatage 
general "sprintf". On peut d'ailleurs faire les conversions decrites precedemment par la fonction "sscanf" 
sans grande difficulty. 

Sur le GS, le systeme et la boite a outils font grand usage de chaines de caracteres ayant une 
representation differente de celle definie par le C. La librairie d'ORCA/C definit 2 fonctions permettant de 
faire des conversions entre le format C et le format Pascal "c2pstr" et "p2cstr". La seule remarque sur 
ces fonctions est qu'elles utilisent un buffer statique propre a la librairie, qui est ecrase a chaque appel; il 
est done de la responsabilite du programmeur les utilisant de les sauver quelque part ailleurs. 

J'ai complete ces 2 fonctions par "c2wstr" et "w2cstr" qui font la meme chose avec des chaines GS/OS, 
dont la longueur est representee par un mot de 16 bits (d'ou le 'w' pour 'word'). Mes fonctions allouent la 
memoire necessaire au stockage du resultat; il n'y a done plus de probleme d'ecrasement potentiel, par 
contre, il ne faut oublier de liberer cette memoire lorsqu'on n'en a plus besoin. 
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Fonctions mathematiques 



Les fonctions mathematiques presentes dans la librairie C standard sont tres completes. On trouve bien 
entendu les fonctions les plus usuelles telles que ['elevation a une puissance quelconque ("pow"), le calcul 
de la racine carree ("sqrt"), les fonctions trigonometriques ("sin", "cos", "tan") et leurs inverses 
("asin", "acos", "atan" et "atan2"), les fonctions logarithmiques et exponentielles ("log", "Iog10" et 
"exp") ou le calcul de la valeur absolue d'un nombre entier ou flottant ("abs", "labs" et "fabs"). 
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Les fonctions moins usuelles que Ton trouve dans la librairie C standard sont les fonctions hyperboliques 
( "sinh", "cosh" et "tanh"; en revanche, il n'y a pas les fonctions inverses dans la librairie ORCA/C, mais 
on les trouve ailleurs; je ne les ai toutefois pas implementees, n'en ayant jamais eu besoin), des fonctions 
d'arrondi flottant ("ceil" et "floor"), des fonctions de calcul du reste d'une division flottante ( "fmod" et 
"modf"), ainsi qu'une fonction de division entiere retournant simultanement le quotient et le reste ("div" 
et "Idiv"). La fonction "frexp" permet de decomposer un nombre flottant en mantisse et exposant, tandis 
que la fonction "Idexp" effectue I'operation inverse. 

J'ai ajoute quelques macros (definies dans "MiscLib.h") a toutes ces fonctions : "abs", "min", "max", 
"sgn" donnent respectivement la valeur absolue d'un nombre (ma version est une macro au lieu d'une 
fonction dans la librairie standard; c'est plus rapide, mais c'est aussi sujet a des effets de bord car 

("argument est evalue 2 fois), le minimum et le maximum de 2 nombres, et le signe d'un nombre. La 
macro "sqr" retourne le carre de I'expression passee en parametre. La macro "round" donne rentier le 
plus proche d'un nombre flottant; I'arrondi est fait par exces dans le cas d'un nombre positif et par defaut 
dans le cas d'un nombre negatif. Les macros "hypot" et "cabs" calculent I'hypotenuse d'un triangle 
rectangle et le module d'un nombre complexe (le calcul est le meme, seul les arguments changent); ces 2 
fonctions font partie de toutes les librairies C que je connais, mais sont curieusement absentes de celle 
d'ORCA/C. 

Enfin, la macro "isnan" indique si son argument est un nombre ou un NAN; si vous ne savez pas ce que 
c'est, je vous renvoie a la documentation de SANE. 



Controle execution et environnement 









La librairie C dispose de plusieurs fonctions permettant d'aller au dela des structures de controles du 
langage. Nous en avons d'ailleurs deja vu quelques unes dans la quatrieme partie de cette initiation; ce sont 
les fonctions "setjmp" et "longjmp" sur lesquelles je ne reviendrai pas ici. 

Lorsqu'on veut terminer un programme C ailleurs qu'a la fin de la fonction "main" (par exemple, 
lorsqu'on a detecte une erreur fatale), on peut appeler I'une des fonctions "exit", "_exit" ou "abort". La 
premiere est utilisee pour terminer proprement un programme, en faisant le menage, tandis que la seconde 
rend directement la main au shell ou au lanceur (par exemple le Finder™) qui assurera ce menage 
(fermeture des fichiers, liberation de la memoire); il est quand meme souhaitable d'eviter d'appeler cette 
fonction dans la plupart des cas. La fonction "abort" est implementee dans ORCA/C comme etant equivalente 
a "_exit(-1)", mais ce n'est pas necessairement le cas dans d'autres environnements. Vous pouvez 
constater que les fonctions "exit" acceptent un parametre qui donnera le resultat final de I'execution du 
programme; cette valeur est surtout utile pour les commandes shell, puisqu'elle indique si I'execution doit 
continuer lorsqu'elle la commande est inseree dans un script. Dans le cas du shell ORCA/C, la valeur 
indique un succes et toute autre valeur correspond a un echec; pour simplifier le portage, le fichier header 
"stdlib.h" delinit 2 symboles "EXIT_SUCCESS" et "EXIT_FAILURE" qu'il est fortemment recommande 
d'utiliser comme parametres des fonctions "exit". 
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Une des actions du menage effectue" par "exit" consiste a appeler une ou plusieurs fonctions du programme 
que Ton aura enregistre au pr6alable par la fonction "atexit". Je vous renvoie au manuel pour voir ce que 
Ton peut faire avec cette fonction. 

Un programme C peut etre inform^ lorsqu'un ev6nement exterieur se produit en utilisant la fonction 
"signal"; celle-ci permet de declarer une fonction qui sera execute lorsque I'exception associee se 
produira, ou d'indiquer au systeme que l'6venement en question doit §tre ignore, ou qu'une action par defaut 
doit etre effectuee (en general, le defaut est d'interrompre I'execution du programme). Les m§canismes mis 
en ceuvre par cette fonction ne sont pas disponibles sur le GS, sauf si Ton utilise GNO/ME; par consequent, 
cette fonction n'est que de peu d'utilite. II est toutefois possible a un programme de simuler une exception en 
utilisant la fonction "raise" qui permettra d'executer la fonction correspondant au signal declenche. 

La gestion des erreurs de la librairie C est plus que rudimentaire, mais elle a le merite d'exister : elle se 
fait au travers d'une variable globale "errno" qui est positionnee par les routines de la librairie 
lorsqu'elles detectent une erreur. Ces routines retournent par ailleurs une valeur particuliere pour 
indiquer qu'une erreur s'est produite. Un piege a eviter est que la librairie ne met jamais "errno" a 
elle-meme; c'est de la responsabilite du programmeur de Papplication de le faire avant d'appeler une 
fonction dont il veut tester la reussite ou I'echec. La variable "errno" peut prendre un tres petit nombre de 
valeurs correspondant a des domaines d'erreur assez vastes. Le libelie associe au code d'erreur peut etre 
affiche a I'ecran (en fait sur stderr) par la fonction "perror" et retourne dans une chame de caracteres 
par la fonction "strerror". Je me suis attache dans mes librairies a positionner "errno" a Tune des 
valeurs predefines en fonction de I'erreur qui s'est produite. 

Pour les erreurs generees par GS/OS ou la Toolbox, ORCA/C a une fonction "toolerrorQ" retournant le 
code de la derniere erreur rencontree. 

La librairie C delinit aussi un mScanisme d'assertion qui permet de verifier qu'une condition est vraie, et 
sinon d'interrompre I'execution du programme. Ce mecanisme est mis en ceuvre par la macro "assert" que 
nous etudierons plus en detail dans mon article sur le debugging. 

La fonction "getenv" permet d'acceder a I'environnement, ce qui dans le cas d'ORCA correspond a la 
recuperation de la valeur d'une variable du shell. La norme ne definit pas de fonction de creation ou de 
modification d'une telle variable, bien que ce soit des fonctions que Ton rencontre frequemment; j'ai done 
developpe les fonctions "putenv", "setenv" et "unsetenv", compiementaires a la pr6cedente. Les 2 
premieres sont identiques mais ont une interface legerement differente; la derniere permet de supprimer 
une variable d'environnement. 

La fonction "system" permet d'ex6cuter une commande quelconque du shell ORCA ou GNO depuis un 
programme C; dans un systeme multitaches, et done notamment sous GNO, cette commande est ex£cutee dans 
le contexte d'un sous-process, tandis que dans le cas d'ORCA, la fonction "system" correspond a ('utilisation 
d'une routine interne du shell. 

La fonction "commandline" est destinee a recuperer la ligne de commande complete, sans beneficier du 
decoupage des arguments effectu6s via les parametres "argc" et "argv" de-la fonction "main". 

Toutes ces fonctions interagissant avec I'environnement d'ex§cution ne sont opGrationnelles que si le 
programme a 6t6 execute dans le contexte d'un shell. Si le programme peut aussi etre lance directement 
depuis le Finder™ ou tout autre lanceur de programme, il ne faudra bien entendu pas les utiliser. La fonction 
"shellid" permet de savoir dans quel contexte le programme est en train de s'executer, car la valeur NULL 
est retournee si Ton n'est pas sous le controle d'un shell. 
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La fonction "userid" permet elle de connaitre I'identifiant qui a ete affecte au programme par le systeme. 
C'est bien entendu une fonction propre au GS et a ORCA/C. 

Les parametres "argc" et "argv" d'une commande shell permettent d'obtenir les valeurs passees a cette 
commande; ces valeurs peuvent etre des options ou des noms de fichiers, utilisant eventuellement des 
wildcards, ou d'autres types d'arguments. 

Le decodage des options d'un programme est souvent une tache fastidieuse et repetitive d'un programme a 
I'autre; la fonction "getopt" presente dans les librairies sous Unix, et dans "MiscLib.h" permet 
d'automatiser ce processus. La version que je vous propose contient plusieurs extensions par rapport a son 
homologue Unix, avec laquelle elle est toutefois compatible a 100%. Je vous recommande d'etudier les 
explications fournies dans les commentaires pour I'utiliser correctement. Vous trouverez aussi une 
demonstration de son utilisation dans le programme "opt", ainsi que dans les commandes shell "size" et 
"dtree" de votre disquette "GS Infos". 

L'expansion des noms de fichiers avec wildcard est realisee par les 2 fonctions "firstfile" et "nextfile" 
derivees de leurs homologues MS-DOS. Ces fonctions sont assez triviales a utiliser et je vous recommande de 
regarder le programme "size.cc" pour avoir un exemple. 



Allocation/Liberation de memoire 

J'ai traite toutes ces fonctions dans mon precedent article, je n'y reviens done pas ici. 

Gestion du temps 



La librairie C standard dispose de fonctions tres completes pour manipuler le temps, qu'elle represente 
sous 3 formats differents : un format litteral (une chaine de caracteres ASCII), un entier long representant 
en general le nombre de secondes ecoulees depuis un temps de reference, et une structure detaillant chacun 
des elements d'une date et d'une heure. 

La fonction "time" permet d'obtenir la date et I'heure actuelle sous la forme d'un entier long. Ensuite, les 
fonctions "localtime" et "gmtime" permettent de le convertir dans la structure detaillee evoquee ci-dessus. 
Pour les systemes gerant les fuseaux horaires, la fonction "localtime" tient compte du decalage horaire de 
fagon a fournir I'heure locale, tandis que "gmtime" donnne I'heure GMT. Le GS ne gerant pas cette notion, 
ces 2 fonctions sont identiques. La fonction "mktime" effectue la conversion inverse, c'est a dire qu'elle 
retourne un entier long a partir d'une structure detaillee. 

La fonction "difftime" permet d'obtenir le temps ecoule en secondes entre 2 temps exprimes dans le 
format entier long. 

La fonction "clock" est un peu a part; dans un systeme multi-taches, elle est censee retourner le temps 
pris par l'ex§cution d'un programme dans une unite qui depend de la resolution interne de I'horloge de la 
machine hote. Sur le GS, ces concepts ne sont pas mis en ceuvre; a la place la fonction "clock" retourne le 
nombre de ticks d'horloge tels que generes par le sous-systeme du heartbeat, mis en action notamment par 
I'outil "Event Manager". 
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Les fonctions "asctime" et "dime" retournent toutes deux la forme Iitt6rale d'une date et heure donnee 
(en anglais); la premiere effectue la conversion a partir de la structure detaillee, tandis que la seconde 
opere sur rentier long. Notez qu'il n'y a pas de fonction effectuant la conversion inverse, c'est a dire 
decodant une chame de caracteres et retournant le temps correspondant dans Tune des 2 formes d^crites 
precedemment. 

Ces 2 fonctions ont tendance a devenir obsoletes, car elles ont ete remplacees lors de la normalisation par 
une fonction de formatage du temps beaucoup plus sophistiquee, et prenant en compte les specificites de 
chaque pays (langue pour les jours et les mois, ordre des informations, ...). Cette fonction, "strftime", 
meme si elle n'etait pas implementable dans son integralite, aurait du faire partie de la librairie d'ORCA/C. 
Ce n'est malheureusement pas le cas, y compris dans la version 2.0 du compilateur. J'en ai done realise une 
implementation, que vous trouverez dans la librairie "StrLib". Cette fonction dispose d'un tres grand 
nombre d'options de formatage, qu'il serait vain de detainer ici; je vous renvoie au commentaire du debut de 
la fonction qui liste toutes les possibilites, et il y en a un tres grand nombre (d'ailleurs, bien que cette 
fonction soit assez triviale — et a ete fastidieuse a ecrire malgre le coupe/colle — , I'optimiseur d'ORCA/C 
vl.x n'arrive pas a la traiter correctement; je n'ai pas reessaye avec la v2.0, suite aux problemes que j'ai 
rencontre avec cette version, et que j'ai deja evoque). Le programme "date" illustre une partie des options 
possibles en affichant la date et I'heure en clair et en francais. Selon les options choisies, mon 
implementation utilise les noms de mois et de jours en anglais ou en frangais. 



Fonctions diverses 






La librairie C comporte quelques fonctions qui n'entrent pas dans les categories precedentes : 

• Une fonction implementant Palgorithme de tri rapide : "qsort". Cette fonction peut trier n'importe quel 
tableau de n'importe quel type d'objet sur n'importe quel critere, grace a ses parametres que je vous laisse 
etudier dans le manuel. 

Nous etudierons cet algorithme de tri, ainsi que quelques autres, dans un prochain article de ma serie sur 
la programmation. 

• Une fonction de recherche dichotomique : "bsearch" fonctionnant avec le meme type de parametres que 
"qsort". Encore une fois, je vous conseille de vous reporter a la documentation. Certaines librairies 
proposent d'autres fonctions de recherche implementant d'autres algorithmes. Nous etudierons cela dans un 
prochain article de ma serie sur la programmation. 

• La librairie d'ORCA/C contient les fonctions "startdesk", "enddesk", "startgraph" et "endgraph", 
facilitant ('initialisation et la terminaison de programmes en mode bureau ou simplement graphiques. Ces 
fonctions peuvent etre utilisees pour des programmes simples, ecrits vite fait sur un coin de table. 

Pour des programmes plus serieux, je vous recommande d'utiliser les fonctions "StartUpTools" et 
"ShutDownTools" de la boite a outils. 

• La macro "offsetof" permet d'evaluer facilement le decalage en octets d'un champ d'une structure, ce 
qui peut etre parfois utile. Jetez un coup d'ceil au manuel pour plus de details. 

• Les fonctions "rand" et "srand" mettent en ceuvre un generateur de nombres pseudo-aleatoires assez 
simple, mais relativement correct. La deuxieme fonction permet d'initialiser le generateur; si on lui passe 
toujours la meme valeur, la serie de nombres retournee par la premiere fonction sera toujours la meme. En 
general, on recupera done I'heure actuelle grace aux fonctions presentees ci-dessus, et on utilisera par 
exemple les secondes comme graine du generateur. 



Chapitre 8 page 1 7 






Initiation C - Chapitre 9 



<^ 



• La macro "va_start B et la fonction "va_end" ainsi que le type "va_arg" permettent de realiser des 
fonctions ayant une liste d'arguments variable, comme c'est le cas par exemple de la fonction "strvcat" 
decrite plus haut. J'ai deja explique ce mecanisme dans mon article sur les fonctions auquel je vous renvoie 
(c'etait la cinquieme partie de mon initiation). 

La librairie "MiscLib" contient aussi quelques fonctions et macros diverses dont je n'ai pas encore parte : 

• Pour les nostalgiques du Basic, j'ai realise une version des fonctions "peek" et "poke" qui permettent 
de lire et d'ecrire n'importe ou en memoire, et notamment d'acceder facilement aux softswitches. Ces 
fonctions existent pour des donnees stockees sur des octets, des mots de 16 bits et des mots de 32 bits : leur 
nom est suivi des lettres "b", "w" ou "I" pour indiquer le type manipule. 

• Les macros "new" et "newstruct" emulent la primitive "new" du Pascal et simplifient I'allocation de 
memoire pour une structure; la premiere est a utiliser quand un type a ete defini via "typedef", la seconde 
correspondant au cas d'une structure n'ayant pas de nom de type assocte par "typedef". 

• J'ai deja presente la macro "swap" : elle effectue la permutation de 2 nombres sans passer par une 
variable intermediate. 

• La fonction "isatty" permet de savoir si I'entree, la sortie ou la sortie des erreurs standards ont ete 
rediriges du clavier ou de I'ecran vers un fichier, au niveau du shell. Cela permet par exemple de n'utiliser 
les sequences de controle du driver de la console ou les caracteres MouseText que si on affiche sur I'ecran. 



Conclusion 



Voila ! Nous avons fait un tour d'horizon assez complet de ce qu'offre la librairie C standard, completee 
par les trois librairies qui accompagnent cet article. 

Comme vous avez pu le constater, cette librairie est assez riche; de plus, il est tres facile de la completer 
par des fonctions qui peuvent garder le meme niveau de generality. Un aspect important du C est que sa 
librairie n'utilise aucun mecanisme specifique, et peut done etre completement ecrite en C elle-meme 
(celle d'ORCA/C est programmee en assembleur), contrairement a celle de Pascal par exemple (je vous 
mets au defi d'ecrire en Pascal des fonctions a arguments variables telles que WRITE ou READ, ou un 
allocateur de memoire ayant la s§mantique de NEW). 

J'espere encore une fois que cette serie vous a interesse, et qu'elle vous a permis de debuter en C. Je vous 
conseille maintenant de prendre I'un des livres que j'ai presente" dans mon premier article, ou le cours de 
ByteWorks si vous maitrisez I'anglais. 
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